Time Series 
Analysis with 
Applications 
inR 


(Second Edition) 


时 间 序列 分 析 帮 应 用 


民 语 言 


Jonathan D. Cryer 
( 美 ) Kung-Sik Chan a 


潘 红 宇 等 译 


( 原 书 第 2 版 ) 


( 原 书 第 2 版 ) 


时 间 序 列 分 析 及 应 用 
R 语 言 

本 书 以 易于 理解 的 方式 讲述 了 时 间 序 列 模型 及 其 应 用 ， 内 容 包 括 趋 势 、 平 稳 时 间 序 列 模型 、 非 平稳 
时 间 序 列 模型 、 模 型 识别 、 参 数 估计 、 模 型 诊断 、 预 测 、 季 节 模 型 、 时 间 序 列 回归 模型 、 异 方差 模型 、 
谱 分 析 入 门 、 谱 估计 和 门限 模型 。 对 所 有 的 思想 和 方法 ， 都 用 真实 数据 集 和 模拟 数据 集 进行 了 说 明 

本 书 的 一 大 特点 是 采用 R 语 言 来 作 图 和 分 析 数 据 ， 书 中 的 所 有 图 表 和 实证 结果 都 是 用 R 命 令 得 到 的 。 作 
者 还 为 本 书 制作 了 大 量 新 增 或 增强 的 R 函 数 ， 可 以 从 www.r-project.org 的 TSA 程 序 包 中 找到 。 此 外 ， 每 一 
章 的 R 命 令 脚 本 文件 ， 可 从 www.stat.uiowa.edu/~kchan/TSA.htm 下 载 aa aE 

本 书 的 另 一 特点 是 包含 很 多 有 用 的 附录 ， 例 如 ， 回 顾 了 有 关 期 望 、 方 差 、 协 方差 、 相 关系 数 等 概 
念 ， 简 述 了 条 件 期 望 的 性 质 以 及 最 小 均 方 误差 预测 等 内 容 ， 这 些 附录 有 利于 关心 技术 细节 的 读者 深入 
了 解 相关 内 容 。 


E 者 简介 

| Jonathan D. Cryer 美国 艾 奥 瓦 大 学 统计 与 精算 学 系 退 休 教授 。 他 是 美国 统计 学 会 会 士 ， 
加 ”获得 过 艾 奥 瓦 大 学 教学 奖 。 除 本 书 外 ， 他 还 与 人 合 著 有 Statistics for Business: Data 
局 


Analysis and Modeling(Second Edition), Minitab Handbook(Fifth Edition), Electronic 
Companion to Statistics, Electronic Companion to Business Statistics 等 书 ， 并 发 表 了 
大 量 学 术 论 文 。 

E Kung-Sik Chan 美国 艾 奥 瓦 大 学 统计 与 精算 学 系 教授 。 他 是 美国 统计 学 会 会 士 、 数 学 统 
E ” 计 学 会 会 员 ， 并 且 是 国际 统计 学 会 推荐 成 员 。 他 于 1996 年 获得 艾 奥 瓦 大 学 系 专 家 奖 。 除 
加 ”本 书 外 ， 他 还 与 人 合 著 有 Chaos: A Statistical Perspective 一 书 ， 并 发 表 了 大 量 学 术 论 文 。 y) 


| Time Series 
Analysis with 
| Applications 
f in R 


(Second Edition) 


ISBN 978-7-111-32572-7 


9787111 325727 


W 网 上 购书 : www.china-pub.com 
phami 46) i His 定价 ; 48.00 元 


Time Series! 


SIS 
si d. LEN PULSER EFSTA RTA OA ORS, is TRE N EE 
“ 


间 序列 分 析 及 应 


( 原 书 第 2 版 ) 


著 ANY UAE RMD a RR 


(3) Jonathan D. Cryer 
Kung-Sik Chan 


本 书 以 易于 理解 的 方式 讲述 了 时 间 序 列 模型 及 其 应 用 ， 主 要 内 容 包括 : 趋势 、 平 稳 时 间 
序列 模型 、 非 平稳 时 间 序 列 模型 、 模 型 识别 、 参 数 估计 、 模 型 诊断 、 预 测 、 季 节 模 型 、 时 间 
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法 ， 都 用 真实 数据 集 和 模拟 数据 集 进行 了 说 明 . 

本 书 可 作为 高 等 院 校 统计 、 经 济 、 商 科 、 工 程 及 定量 社会 科学 等 专业 学 生 的 教材 或 教学 
参考 书 ， 同 时 也 可 供 相关 技术 人 员 使 用 . 

Translation from the English language edition; Time Series Analysis with Applications in 
R , Second Edition (ISBN 978-0-387-75958-6) by Jonathan D. Cryer and Kung-Sik Chan. 

Copyright © 2008 Springer Science+ Business Media, LLC. 

Springer is a part of Springer Science+Business Media. 

All Rights Reserved. 


本 书 中 文 简体 字 版 由 Springer Science+Business Media 授权 机 械 工 业 出 版 社 独家 出 版 ， 未 
经 出 版 者 书面 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 内 容 . 


封底 无 防伪 标 均 为 盗版 


版 权 所 有 ， 侵 权 必 究 
本 书法 律 顾问 ”北京 市 展 达 律师 事务 所 


本 书 版 权 登 记号 : AS: 01-2010-6353 

图 书 在 版 编目 (CIP) 数据 

时 间 序 列 分 析 及 应 用 : R 语言 ( 原 书 第 2 版 ) /( 美 ) 克莱尔 (Cryer, J.D.) BH; MA 
字 等 译 ， 一 北京 :机械 工业 出 版 社 ，2011. 1 

(华章 数学 译 从 ) 

书 名 原文 ; Time Series Analysis with Applications in R, Second Edition 

ISBN 978-7-111-32572-7 

J. 时 … Oxe Owe M. 时 间 序 列 分 析 N. O211. 61 

中 国 版 本 图 书馆 CIP 数据 核 字 (2010) 第 231026 号 

机 械 工业 出 版 社 〈 北 京 市 西城 区 百 万 庄 大 街 22 号 ”邮政 编码 ”100037) 

责任 编辑 : RRE 

北京 市 荣 盛 彩色 印 出 有 限 公 司 印 性 

2011 年 1 月 第 1 版 第 1 次 印刷 

186mm X 240mm « 22. 5 印张 

标准 书号 : ISBN 978-7-111-32572-7 

定价 : 48. 00 元 

凡 购 本 书 ， 如 有 缺 页 、 倒 页 、 脱 页 ， 由 本 社 发 行 部 调换 

客服 热线 : (010) 88378991; 88361066 

购书 热线 : (010) 68326294; 88379649; 68995259 

投稿 热线 : (010) 88379604 

读者 信箱 : hzjsj@hzbook.com 


译 者 & 

时 间 序 列 的 教材 版 本 众多 ， 其 中 有 的 教材 侧重 理论 的 讲述 ， 读 者 需要 具备 较 深厚 的 数学 基 
础 ， 主 要 阅读 对 象 是 统计 类 专业 的 学 生 ; 有 的 教材 则 注重 模型 的 应 用 ， 理 论 和 技术 细节 不 是 重 
点 ， 主 要 面向 经 济 类 专业 的 学 生 . 而 由 Jonathan D. Cryer 和 Kung- Sik Chan 所 著 的 本 书 则 均 
衡 地 介绍 了 时 间 序 列 的 理论 与 应 用 ， 使 之 能 满足 更 多 专业 方向 的 学 生 和 研究 者 的 需求 .在 理论 
方面 ， 本 书 给 出 一 般 性 理论 描述 的 同时 ， 注 重 通过 各 种 简单 特例 演绎 具体 的 推导 过 程 ， 因 而 清 
晰 地 阐释 了 有 关 结 论 ， 方 便 读 者 对 理论 的 理解 . 在 一 些 章节 后 面 ， 还 通过 附录 的 方式 ， 补 充 给 
出 了 正文 里 有 关 结 论 的 数学 推导 和 相关 基本 概念 ， 为 熟悉 数学 理论 的 读者 提供 了 深入 理解 各 类 
方法 的 素材 ， 在 应 用 方面 ， 本 书 提供 了 基于 模拟 数据 和 取材 广泛 的 真实 数据 的 丰富 例证 ， 通 过 
基于 模拟 数据 的 例子 使 读者 深刻 认识 时 间 序 列 的 基本 性 质 ， 而 通过 基于 真实 数据 的 例子 使 读者 
体会 模型 的 实际 应 用 效果 . 

本 书 的 另 一 个 特色 是 ， 各 章 都 提供 了 实现 所 有 实证 结果 的 R 程序 ， 并 在 附录 工 里 对 RG 
言 给 出 了 详细 介绍 ， 作 为 一 款 免 费 的 软件 ，R 语言 可 提供 广泛 的 统计 和 作 图 技术 ， 并 且 具 有 高 
度 扩展 性 ， 已 为 统计 学 家 和 计量 经 济 学 家 广泛 使 用 . 另外 ， 很 多 最 新 的 理论 方法 的 R 实现 程 
序 还 可 以 很 方便 地 从 网 络 上 查找 到 ， 通 过 本 教材 的 学 习 ， 读 者 能 够 快速 掌握 R 软件 的 使 用 方 
法 ， 利 用 既 有 的 程序 达成 研究 目的 . 

本 书 适合 一 学 期 的 教学 安排 ,内 容 介 绍 深入 浅 出 ， 概 念 严谨 准确 ， 是 一 本 不 错 的 人 门 
教材 . 

本 书 的 翻译 工作 凝聚 了 多 人 的 劳动 ， 具 体 分 工 如 下 : 潘 红 宇 翻译 了 第 1、2、7、13、14、 
15 章 ， 王 玲玲 翻译 了 第 3 章 和 第 9 章 ， 李 瑶 帆 翻译 了 第 4 章 和 第 5 章 ， 梁 丽 英 翻译 了 第 6 章 和 
第 8 章 ， 关 展 翻 译 了 第 10 章 和 第 11 章 ， 闵 敏 翻 译 了 第 12 章 ， 秦 智 鹏 翻译 了 第 16 章 . 最 后 ， 
由 潘 红 宇 对 全 书 进行 了 统 稿 . 

由 于 译 者 水 平 有 限 ， 译 稿 中 的 芒 漏 在 所 难免 ， 敬 请 读者 批评 指正 . 


译 者 
2010 年 11 月 
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自 1970 年 George E. P. Box 和 Gwilym M. Jenkins 的 奠基 性 著作 《时 间 序 列 分 析 : 预报 与 
控制 》(Time Series Analysis: Forecasting and Control) fal tt MK (该 书 已 在 Gregory 
C. Reinsel 的 加 盟 下 ， 于 1994 年 出 版 了 第 3 版 )， 时 间 序 列 分 析 的 理论 和 实践 都 有 了 飞速 发 展 ， 
也 涌现 了 一 大 批 时 间 序 列 方面 的 书籍 ， 遗 憾 的 是 有 些 书 欠缺 实际 应 用 的 论述 ， 而 另 一 些 书 则 理 
论 基 础 薄弱 ， 本 书 力图 同时 介绍 时 间 序 列 的 理论 与 应 用 ， 采 用 自然 的 方式 将 两 方面 内 容 有 机 地 
结合 起 来 ， 使 之 能 够 为 范围 更 广 的 学 生 和 实践 工作 者 所 理解 和 接受 . 

本 书 可 作为 一 学 期 的 课程 教材 ， 供 统计 、 经 济 、 商 科 、 工 程 及 定量 社会 科学 等 专业 学 生 使 
用 ,读者 需要 具备 从 基本 应 用 统计 到 多 元 线性 回归 等 多 方面 的 基础 知识 .只 要 读者 具备 求解 类 
似 平方 和 最 小 化 等 问题 深度 的 微 积 分 知识 ， 即 可 阅读 本 书 ， 而 要 深入 理解 本 书 部 分 理论 ， 则 需 
具备 基于 微 积 分 的 统计 引 论 基础 ， 书 中 附录 回顾 了 有 关 期 望 、 方 差 、 协 方差 、 相 关 等 概念 ， 并 
简 述 了 条 件 期 望 的 性 质 以 及 最 小 均 方 误差 预测 等 内 容 ， 全 书 采用 来 自 不 同 专业 领域 的 实际 时 间 
序列 数据 来 阐述 方法 论 . 本 书 还 包括 部 分 高 级 内 容 ， 教 师 可 酌情 选 讲 . 

书 中 所 有 的 图 和 数值 输出 均 使 用 R 软件 得 到 ， 该 软件 可 从 www. r-project. org 上 的 “The 
R Project for Statistical Computing” 得 到 ， 为 简明 起 见 ， 我 们 对 部 分 数值 输出 进行 了 处 理 ， 作 
为 一 款 免 费 软件 ，R 软件 的 源 代码 格式 符合 自由 软件 基金 会 GNU 通用 公共 许可 证 规定 ， 可 以 
在 UNIX 平 台 及 Windows、MacOS 等 类 似 操作 系统 上 运行 . 

R 是 一 种 可 用 于 统计 计算 和 作 图 的 编程 语言 及 环境 ， 可 提供 广泛 的 统计 例如， 时间 序 列 
分 析 、 线 性 及 非 线 性 建 模 、 经 典 的 统计 检验 ) 及 作 图 技术 ， 并 且 具 有 高 度 的 扩展 性 ， 在 附录 工 
“R 人 门 ” 中 ， 采 用 与 本 书 内 容 相配 的 方式 对 R 软件 进行 了 介绍 . 本 书 作者 之 一 〈Kung- Sik 
Chan) 制作 了 大 量 可 用 于 本 书 的 新 增 或 增强 的 R 函数 ， 列 于 附录 工 的 最 后 ， 并 可 从 R 计划 网 
站 www. r-project. org 上 的 TSA 程序 包 中 找到 ， 我 们 还 为 每 一 章 建 立 了 R 命令 脚本 文件 ， 可 
从 本 书 网 站 www. stat. uiowa. edu/~kchan/TSA. htm FR. 本 书 中 ， 每 一 个 图 表 下 都 给 出 了 R 
代码 ; 习题 所 需 数 据 集 合 均 有 相关 的 文件 名 ， 例 如 洛杉矶 降雨 量 的 数据 文件 命名 为 larain， 而 如 
果 读 者 使 用 的 是 TSA 程序 包 ， 则 该 数据 集合 是 程序 包 的 一 部 分 ， 可 通过 R 命令 data(larain) 
取得 . 

本 书 所 有 数据 集合 以 ASCII 码 文件 的 形式 放 在 网 站 上 ， 并 在 文件 第 一 行 标注 了 各 自 名 称 . 
书 中 很 多 图 及 计算 结果 ,使 用 SAS®, Splus®, Statgraphics®, SCA®, EViews®, RATS®, 
Ox® 及 其 他 软件 也 可 以 得 到 . 

本 书 是 1986 年 PWS-Kent Publishing (Duxbury Press) 出 版 的 Jonathan Cryer 所 著 《 时 
间 序 列 分 析 》 第 2 版 ， 新 版 在 补充 大 量 最 新 材料 、 数 据 集合 和 习题 的 同时 ， 仍 然 包 括 所 有 已 为 
读者 熟悉 的 原版 内 容 . 其 中 既 有 与 原版 内 容 融 为 一 体 的 若干 新 论题 ， 如 涉及 单位 根 检验 、 扩 展 
自 相关 函数 、ARIMA 模型 子 集 以 及 自助 法 等 内 容 ， 也 有 时 间 序 列 回 归 模 型 、 异 方差 时 间 序 列 
模型 、 谱 分 析 和 门限 模型 等 全 新 的 章节 . 与 基本 内 容 相 比 ， 新 章节 内 容 的 难度 水 平 有 某 种 程度 
的 提高 ， 但 我 们 确信 本 书 所 采用 的 讨论 方式 易 为 读者 接受 ， 一定 会 对 广泛 的 读者 群 学 习 相 关内 
容 有 所 帮助 . 虽然 涉及 非 线 性 时 间 序 列 模型 的 第 15 章 〈 门 限 模型 ) 位 于 本 书 的 最 后 ， 但 相关 


V 


内 容 也 可 以 根据 教学 需要 提前 讲授 ， 例 如 可 以 在 第 12 章 之 后 讲授 ， 同 样 ， 讨 论 谱 分 析 的 第 
13、14 两 章 内 容 也 可 以 在 第 10 章 之 后 学 习 . 

感谢 Springer 出 版 社 “ 统 计 学 丛书” 的 责任 编辑 John Kimmel， 他 在 本 书 长 时 间 的 写作 过 
程 中 给 予 了 作者 持续 的 关注 与 指导 . 伦敦 经 济 学 院 的 汤 家 豪 教授 、 中 国 台 北 中 央 研 究 院 的 葡 恒 
修 教授 、 西 北大 学 的 Noelle Samia 教授 、 中 国 香港 大 学 的 李 伟 强 教授 和 吴 启 宏 教授 、 奥 斯 陆 大 
学 的 Nils Christian Stenseth 教授 等 热心 研读 过 书稿 部 分 章节 ，Jun Yan 教授 曾 以 本 版 初稿 为 教 
材 在 艾 奥 瓦 大 学 某 班 授课 ， 感 谢 他 们 对 本 书 提出 的 宝贵 的 建设 性 意见 .感谢 Samuel Hao 帮助 
整理 习题 解答 和 附录 工 两 部 分 内 容 . 这 里 还 要 对 在 不 同 阶段 匿名 审阅 并 帮助 改进 书稿 的 审阅 者 
一 并 致谢 ， 最 后 ， 作 者 之 一 Jonathan D. Cryer) 也 借 此 机 会 ， 向 在 写作 新 版 第 一 稿 时 提供 了 
墨西哥 城 圣 地 亚 哥 俱乐部 Casa de Artes 舒适 写作 环境 的 Dan, Marian 和 Gene 表达 诚挚 的 
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通过 一 系列 时 间 点 上 的 观测 来 获取 数据 是 司空 见 惯 的 活动 .在 商业 上 ， 我 们 会 观测 周 利 
率 、 日 股票 闭 盘 价 、 月 价格 指数 、 年 销售 量 等 .在 气象 上 ， 我们 会 观测 每 天 的 最 高 温度 和 最 低 
温度 、 年 降水 与 干旱 指数 、 每 小 时 的 风速 等 .在 农业 上 ， 我 们 会 记录 每 年 作物 和 牲畜 产量 、 土 
壤 侵 蚀 、 出 口 销售 等 方面 的 数字 ， 在 生物 科学 上 ， 我 们 会 观测 每 毫秒 心 电 活动 的 状况 .在 生态 
学 上 ， 我 们 会 记录 动物 种 群 数量 的 变动 情况 .实际 上 ， 需 要 研究 时 间 序 列 的 领域 是 难以 罗列 
的 ， 时 间 序 列 分 析 的 目的 一 般 有 两 个 方面 : 一 是 认识 产生 观测 序列 的 随机 机 制 ， 即 建立 数据 生 
成 模型 ， 二 是 基于 序列 的 历史 数据 ， 也 许 还 要 考虑 其 他 相关 序列 或 因素 ， 对 序列 未 来 的 可 能 取 
值 给 出 预测 或 预报 . 

本 章 将 从 广泛 的 应 用 领域 中 ， 介 绍 一 些 时 间 序 列 的 实例 .时 间 序 列 及 其 模型 的 一 个 独特 的 
性 质 是 ， 通 常 我 们 不 能 假定 观测 值 独立 取 自 同 一 总 体例 如 ， 取 自 均 值 不 同 的 总 体 )， 时 间 序 
列 分 析 的 要 点 是 研究 具有 相关 性 质 的 模型 . 


1. 1 时 间 序 列举 例 

本 节 介 绍 几 个 时 间 序 列 的 例子 ， 后 续 章 节 将 进一步 对 其 讨论 . 

洛杉矶 年 降水 量 

图 表 1-1 是 加 利 福 尼 亚 州 洛杉矶 地 区 100 多 年 来 的 年 降水 量 时 间 序 列 图 ， 从 图 中 可 以 看 出 ， 
降水 量 在 这 些 年 有 显著 的 差异 一 一 有 的 年 份 降水 量 低 ， 有 的 年 份 降水 量 高 ， 其 他 年 份 介 于 两 者 之 
间 ， 对 洛杉矶 来 说 ，1883 年 无 疑 是 湿度 特别 大 的 一 年 ， 而 1983 年 则 相当 干燥 .为 了 分 析 和 建 模 
需要 ， 我 们 关心 的 是 相 邻 年 份 的 降水 量 是 否 存在 某 种 关联 ， 若 是 ， 则 可 能 依据 当年 的 降水 量 数据 
预测 来 年 的 降水 量 ， 我 们 可 以 画 出 相 邻 年 份 降水 量 的 散 点 图 ， 通 过 图 形 来 研究 这 个 问题 . 

图 表 1-1 洛杉矶 年 降水 量 时间 序 列 图 
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> library (TSA) 
> win.graph(width=4.875, height=2.5,pointsize=8) 
> data(larain); plot (larain, ylab='Inches',xlab='Year',type='o') 


图 表 1-2 是 由 此 绘 出 的 降水 量 散 点 图 .例如 ， 右 下 角 的 点 显示 降水 量 非常 大 的 1883 年 -40 
英寸 的 降水 量 ， 其 后 1884 年 降水 量 中 等 〈 约 12 英寸 )， 图 中 靠近 顶部 的 点 表明 40 英寸 降水 量 
的 年 份 ， 其 上 一 年 降水 量 比较 典型 ， 大 约 15 英寸 . 


图 表 1-2 ”洛杉矶 当年 降水 量 与 去 年 降水 量 散 点 图 


> win.graph (width=3,height=3,pointsize=8) 
> plot (y=larain,x=zlag (larain) ,ylab='Inches', 
xlab='Previous Year Inches') 


该 图 给 人 的 主要 印象 是 当年 降水 量 与 去 年 降水 量 几 乎 没有 什么 联系 ， 既 无 “趋势 "， 也 没 
有 一 般 倾 向 ， 上 一 年 与 当年 降水 量 的 相关 性 非常 小 ， 从 预测 和 建 模 的 角度 ， 这 样 的 时 间 序 列 没 
什么 研究 意义 . 

化 工 过 程 

第 二 个 例子 是 来 自 某 化 工 过 程 的 时 间 序 列 . 这 里 变量 度量 的 是 过 程 中 连续 批 次 颜色 的 属 
性 .图表 1-3 是 颜色 值 的 时 间 序 列 图 . 相 邻 时 刻 的 颜色 值 差 别 不 大 ， 似 乎 相互 之 间 存 在 
KK. 


图 表 1-3 某 化 工 过 程 中 颜色 属性 的 时 间 序 列 图 


> win.graph (width=4.875, height=2.5,pointsize=8) 
> data (color) 
> plot (color,ylab='Color Property',xlab='Batch',type='o') 


像 第 一 个 例子 那样 ， 制 作 一 个 相 邻 数据 的 散 点 图 更 能 说 明 问 题 . 
图 表 1-4 是 相 邻 颜 色 值 的 散 点 图 .该 图 显示 了 一 个 稍微 向 上 的 趋势 一 一 数值 较 小 后 面 的 批 
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次 趋 于 较 小 的 值 ， 中 等 值 后 面 的 批 次 趋 于 中 等 值 ， 数 值 较 大 后 面 的 批 次 趋 于 较 大 的 值 ， 该 趋势 
明显 但 并 不 非常 强烈 ， 例 如 ， 散 点 图 的 相关 系数 约 为 0. 6. 


图 表 1-4 当前 颜色 值 与 前 期 颜色 值 的 散 点 图 


颜色 性 质 


上 一 批 次 颜色 属性 


> win.graph (width=3,height=3,pointsize=8) 
> plot (y=color,x=zlag(color),ylab='Color Property', 
xlab='Previous Batch Color Property') 


加 拿 大 野兔 年 丰 度 

第 三 个 例子 是 加 拿 大 野兔 的 年 丰 度 .图 表 1-5 给 出 了 大 约 30 年 里 该 丰 度 的 时 间 序 列 图 . 
此 例 中 ， 相 邻 数据 联系 非常 密切 ， 年 度数 据 间 没 有 大 的 变化 .从 图 表 1-6 当年 与 上 一 年 数量 
的 散 点 图 上 ， 可 以 看 到 相 邻 数据 间 存 在 明显 的 相关 性 ， 类似 上 例 ， 图 形 显示 出 一 个 网 上 的 起 
势 一 一 较 小 数值 次 年 趋 于 较 小 的 数值 ， 中 等 数值 趋 于 中 等 数值 ， 较 大 的 数值 趋 于 较 大 的 
数值 . 


图 表 1-5 加拿大 野兔 丰 度 
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> win.graph (width=4.875, height=2.5,pointsize=8) 
> data(hare); plot (hare, ylab='Abundance',xlab='Year',type='o') 
S 


图 表 1-6 ”当年 与 上 一 年 野兔 丰 度 散 点 图 


上 一 年 丰 度 


> win.graph(width=3, height=3,pointsize=8) 
> plot (y+hare,x=zlag (hare) ,ylab='Abundance', 
xlab='Previous Year Abundance’) 


艾 奥 瓦 州 迪 比 克 市 月 平均 气温 
艾 奥 瓦 州 迪 比 克 市 若干 年 里 月 平均 气温 CERE) 的 记录 见 图 表 1-7. 
图 表 1-7 艾 奥 瓦 州 迪 比 克 市 月 平均 气温 
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> win.graph (width=4.875, height=2.5,pointsize=8) 
> data(tempdub); plot (tempdub,ylab='Temperature',type='0') 


该 时 间 序 列 显 示 了 一 种 规则 的 被 称 为 季节 性 的 模式 . 当 分 布 在 12 个 月 的 观测 值 以 某 种 方 
式 联系 起 来 后 ， 月 度 季节 性 就 会 显现 出 来 比如， 每 年 1 月 、2 月 相当 寒冷 ,温度 近似 ,但 是 
与 温暖 的 6 月 、7 月 、8 月 的 温度 差别 很 大 ， 不 间 年 份 1 月 的 温度 值 有 差异 ， 同 样 ， 不 同年 份 6 
月 的 数值 也 有 变化 .适用 于 这 类 序列 的 模型 ， 必 须 反 映 出 数据 间 的 差异 及 其 相似 性 ， 此 例 中 数 
据 产生 季节 性 的 原因 很 好 理解 一 一 北半球 面向 太阳 的 倾角 随 季 记 变 化 所 致 . 

滤 油 器 月 销售 量 

本 章 最 后 一 个 例子 是 出 售 给 经 销 商 的 滤 油 器 月 销售 量 ， 该 滤 油 器 由 John Deere 生产 ， 是 
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用 于 建筑 设备 的 特制 滤 油 器 ， 向 作者 之 一 提供 数据 时 ， 经 理 说 , “没有 理由 认为 销售 量 存在 季 
节 性 . ”假如 各 年 1 月 与 1 月 的 数据 间 存 在 关联 趋势 ，2 月 与 2 月 的 数据 间 存 在 关联 趋势 ， 等 
等 ， 那 么 季节 性 就 存在 ， 图表 1-8 没有 显示 出 明显 的 季节 性 . 图 表 1-9 与 图 表 1-8 相同 ， 但 是 
增加 了 有 意义 的 符号 对 数据 点 进行 标识 .图 中 所 有 1 月 的 数值 标 以 相同 字母 J，2 月 的 数值 标 
以 人，3 月 的 标 以 M， 等 等 S. 借助 这 些 点 所 标记 的 符号 ， 很 容易 看 出 所 有 1 月 、2 月 等 冬季 月 
份 的 销量 往往 很 高 ， 而 9 月 、10 月 、11 月 等 月 份 的 销量 一 般 很 低 ， 数 据 的 季节 性 在 这 个 处 理 
过 的 时 间 序 列 图 上 是 显而易见 的 ， 


图 表 1-8 Mme Ane mM 


1984 1985 1986 1987 
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> data (loilfilters); plot (oilfilters,type='o',ylab='Sales') 


图 表 1-9 ”以 特殊 符号 绘制 的 滤 油 器 月 销售 时 


6000 = 
zr 4000 
| 
2000 a i i 
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F=2 月 , M=3 月 (和 5 月 ) , 以 此 类 推 


> plot (oilfilters,type='1',ylab='Sales') 
> points (y=oilfilters,x=time(oilfilters), 
peh=as.vector (season(oilfilters) )) 


总 之 ， 我 们 的 目的 是 ， 强 调 恰当 和 有 益 于 发 现 特定 模式 的 绘图 方法 ， 有 利于 找到 符合 时 间 


马 ”、 看 图 时 ， 读 者 仍然 需要 区 分 1 月, 6 月 和 7 月 ( 译 者 注 ; January，June，July)， 同 样 要 区 分 3 月 与 5 月 (AAIE: 
March，May)，4 月 与 8 月 〈 译 者 注 ， April，August) ， 但 通过 对 比 相 邻 点 上 的 符号 很 容易 区 分 它们 ， 
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序列 数据 的 合适 模型 ， 在 后 续 的 章节 中 ， 我 们 将 探讨 一 些 在 时 间 序 列 模型 里 引信 季节 性 的 不 同 
方式 . 


1.2 建 模 策略 


给 时 间 序 列 寻 找 合适 的 模型 并 非 易 事 ， 下 面 介 绍 Box and Jenkins(1976) 书 中 推崇 的 多 步 
建 模 策 略 ， 该 过 程 包括 三 个 可 反复 使 用 的 主要 步骤 ， 

1. 模型 识别 〈 或 称 作 辨识 ) 

2. 模型 拟 合 

3. 模型 诊断 

在 模型 识别 阶段 ， 从 时 间 序 列 模型 类 中 选择 适合 观测 数据 的 模型 .这 一 步 我 们 可 以 观察 该 
序列 的 时 间 序 列 图 ， 从 数据 出 发 计算 一 些 不 同 的 统计 量 ， 也 可 以 利用 任何 生成 该 序列 的 背景 知 
识 ， 比 如 生物 学 、 商 业 或 生态 学 方面 的 知识 等 ， 需 要 强调 的 是 目前 选取 的 模型 是 待考 的 ， 将 在 
以 后 的 分 析 过 程 中 予以 修正 . | 

模型 选取 遵从 简约 原则 ， 即 应 在 能 充分 表示 时 间 序 列 的 前 提 下 模型 所 含 参 数 个 数 最 少 ， 
正 像 Parzen(1982，68 页 ) 中 引用 的 爱 因 斯 坦 的 名 言 所 说 , “凡事 皆 宜 尽力 简化 ， 只 要 不 失 
之 草率 .8” 

模型 所 含 的 一 个 或 多 个 参数 需 由 观测 序列 给 出 估计 ， 模 型 拟 合 就 是 要 找到 给 定 模型 之 未 知 
参数 的 最 优 估计 ， 我 们 采用 的 估计 优化 准则 是 最 小 二 乘法 则 和 极 大 似 然 法 则 . 

模型 诊断 关注 于 完成 设 定 、 估 计 步 又 之 后 所 确定 模型 的 质量 评估 问题 ， 模 型 对 数据 的 拟 合 
度 有 多 好 ? 适用 模型 的 前 提 能 和 否 合理 地 得 到 满足 ?” 经 诊断 没有 不 足 之 处 ， 则 建 模 过 程 就 结束 
了 ， 所 确定 的 模型 也 就 可 以 应 用 了 ， 例 如 可 用 于 预测 序列 未 来 的 取 值 等 。 否则， 针对 找到 的 不 
足 选取 其 他 模型 ， 即 重新 开始 模型 设 定 步 又 .采用 这 种 方法 ， 通 过 反复 进行 上 述 三 个 步骤 ， 我 
们 最 终 能 够 找到 一 个 理想 的 、 可 接受 的 模型 ， 

由 于 建 模 的 每 一 步 都 要 进行 繁杂 的 计算 ， 所 以 实际 中 可 以 依赖 已 有 的 统计 软件 进行 这 些 计 
算 ， 并 绘 出 图 形 . 


1.3 历史 上 的 时 间 序 列 图 


根据 Tufte(1983, 28 页 〉 的 说 法 ,“ 时 间 序 列 图 是 图 形 设计 最 常用 的 形式 ， 其 一 个 维度 沿 
着 秒 、 分 、 时、 日 、 周 、 月 、 年 ， 力 至 千年 等 规则 的 时 间 节 律 延 伸 ， 时 间 标 度 的 自然 顺序 赋 寺 
了 这 种 设计 以 解释 的 力量 和 效率 ， 这 一 点 在 其 他 图 形 设计 上 了 无 狠 迹 .” 

图 表 1-10 重 现 了 有 可 能 是 目前 已 知 的 最 古老 的 时 间 序 列 图 ， 这 个 显示 行星 轨道 倾角 ”的 图 
可 以 上 潮 到 公元 10 世纪 (或 11 世纪 )，Tufte 对 此 的 评价 是 :“ 这 似乎 是 数据 作 图 历史 上 一 个 
神秘 而 孤立 的 杰作 ， 因 为 目前 所 知 下 一 个 时 间 序 列 图 的 出 现 是 800 多 年 以 后 的 事 了 .” 


斩 ”爱国 斯 坦 的 原文 是 “everything should be made as simple as possible, but not simpler”. -一 一 译 者 注 
© 见 Tufte(1983，28 H). 
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图 表 1-10 a 10 世纪 的 时 间 序 列国 


1.4 本 书 概述 


第 2 章 介 绍 均值 、 方 差 、 相 关 函 数 等 基本 概念 ， 以 重要 的 平稳 性 概念 结束 ， 第 3 章 探讨 趋 
势 分 析 的 内 容 ， 并 针对 常用 的 有 确定 性 趋势 的 模型 ， 例 如 有 线性 时 间 趋 势 及 季 布 性 均值 的 模 
型 ， 讨 论 了 估计 和 验证 的 方法 . 

自 第 4 章 起 ， 开 始 介绍 平稳 时 间 序 列 的 参数 模型 ， 即 所 谓 的 自 回归 滑动 平均 CARMA) 模 
型 (也 称 为 Box-Jenkins 模型 )， 此 类 模型 扩展 后 ， 可 以 涵盖 某 些 随机 非 平 稳 的 情况 一 一 ARTL- 
MA 模型 ， 相 关 论 述 见 第 5 章 . 

第 6、7、8 这 三 章 介绍 ARIMA 模型 核心 的 建 模 策 略 ， 包 括 初 步 设 定 模型 的 技术 〈 见 第 6 
章 ) ， 使 用 最 小 二 乘法 和 极 大 似 然 法 有 效 估 计 模 型 参数 ( 见 第 7 章 ) ， 以 及 确定 模型 对 数据 如 何 
更 好 拟 合 的 方法 〈 兄 第 8 章 ). | 

第 9 章 深 入 阐述 ARIMA 模型 的 最 小 均 方 误差 预测 理论 与 方法 . 第 10 MILA 4 章 到 第 9 章 介 
绍 的 思路 进一步 扩展 ， 以 应 用 于 随机 季节 模型 分 析 上 .后 续 各 章 探 讨 选 定 的 若干 高 等 主题 . 


习题 


1. 1 应 用 软件 绘 出 与 图 表 1-2 一 样 的 时 间 序 列 图 ， 数 据 在 名 为 larain 的 文件 中 . 

1.2 绘 出 与 图 表 1-3 一 样 的 时 间 序 列 图 ， 数 据 文件 名 是 color, 

1.3 模拟 一 个 长 度 48， 完 全 随机 的 独立 正 态 分 布 过程 ， 并 绘 出 时 间 序 列 图 ， 看 看 是 否 显示 出 
“随机 性 ”? 使 用 不 同 的 模拟 样本 ， 多 次 重复 本 练习 . 

1.4 模拟 一 个 长 度 48， 完 全 随机 、2 个 自由 度 的 独立 X 分 布 过 程 ， 并 绘 出 时 间 序 列 图 ， 看 看 
是 否 显示 出 “随机 性 ”和 非 正 态 性 ? 使 用 不 同 的 模拟 样本 ， 多 次 重复 本 练习 . 

1.5 模拟 一 个 长 度 48， 完 全 随机 、5 个 自由 度 的 独立 上 分 布 过 程 ， 并 绘 出 时 间 序 列 图 . 看 看 
是 否 显 示 出 “随机 性 ”和 非 正 态 性 ? 使 用 不 同 的 模拟 样本 ， 多 次 重复 本 练习 . 

1.6 给 出 与 图 表 1-9 一 样 的 时 间 序 列 图 ， 并 对 图 上 迪 比 克 市 温度 序列 给 出 月 度 标志 ， 相 关 数 

据 在 名 为 tempdub 的 文件 中 ， 


= 


旺 ” 如 果 读 者 已 从 www. rprojeet. org 下 载 并 安装 了 民 程 序 包 TSA， 则 larain 数据 可 通过 R 命令 dataflarain) 取得 ， 在 
本 书 主页 www. stat. uiowa, edu/~kchan/TSA. htm 上 也 有 相关 数据 的 ASCII 文件 . 


第 2 章 基本 概念 


本 章 介绍 时 间 序 列 模 型 理论 中 的 基本 概念 .特别 地 ， 我 们 介绍 了 随机 过 程 、 均 值 、 协 方差 
前 数 、 和 平稳 过 程 和 目 相 关 函 数 等 概念 . 


2.1 了 时 间 序 列 与 随机 过 程 


随机 变量 序列 (Y: c=0, +1, £2, £3, =} 称 为 一 个 随机 过 程 ， 并 以 之 作为 观测 时 
间 序 列 的 模型 .已 知 该 过 程 完整 的 概率 结构 是 由 所 有 Y 的 有 限 联合 分 布 构成 的 分 布 族 决定 的 . 
幸运 的 是 ， 联 合 分 布 中 的 大 部 分 信息 可 以 通过 均值 、 方 差 和 协 方 差 加 以 描述 ， 我 们 无 需 直 接 处 
理 这 些 多 元 分 布 . 因此 ， 我 们 将 把 注意 力 集 中 在 对 一 阶 和 二 阶 矩 的 研究 上 . (如 果 Y 的 联合 分 
布 是 多 元 正 态 分 布 ， 则 所 有 的 联合 分 布 都 可 以 由 一 阶 和 二 阶 矩 完全 确定 . ) 


2.2 均值 、 方 差 和 协 方差 


对 随机 过 程 {Y,: 上 =0， 士 1， 土 2， 土 3，…}， 均 值 函 数 定义 如 下 : 
= E(Y,),t =0,41,+2.°% (2. 2. 1) 
BD u 恰 是 过 程 在 上 时 刻 的 期 望 值 ， 一 般 地 ， 不 同时 刻 j, 可 取 不 同 的 值 . 
自 协 方差 函数 7,,, 定 义 如 下 : 
Y, = Cov(Y,,Y,),t5 一 0, 十 1, £25: (2. 2. 2) 
其 中 Cov(Y,, Y,)SEL(Y, — pm) CY. — u) J= ECY,Y,)— pp 
自 相 关 范 数 p.,, 由 下 式 给 出 : 
p's = Corr(Y, Y.) tos = 0,1, £2, (2. 20a) 
其 中 
Cov(Y,,Y,) ae e 
Corr(Y,,Y,) = NANa = Se CD ety 
在 附录 A 中 ， 我 们 回顾 了 期 望 、 方 差 、 协 方差 和 相关 的 基本 性 质 . 
回忆 下 述 结论 ， 协 方差 和 相关 系数 都 是 随机 变量 间 (线性 ) 相关 关系 的 度量 ， 而 某 种 程度 
上 无 量 纲 的 相关 系数 更 容易 理解 ， 那 么 从 已 知 的 结果 及 前 述 定 义 ， 可 得 如 下 的 重要 性 质 : 
Yt = Var(Y，) Pur = 1 
Vie 一 Yau Pis = Pat pe 


POs en ee 
os 的 值 接近 士 1 时 ， 说 明 (线性) 相关 程度 强 ， 而 接近 0 时 ， 则 说 明 〈 线 性 ) 相关 程度 
$. FF o =O, WER Y, AY, 不 相关 . 
在 研究 不 同时 间 序 列 模型 协 方差 的 性 质 时 ， 反 复 用 到 如 下 结论 : 如 果 cl ，c: ,…，cm 和 
di» dz so*s d, 表示 常数， bis te se bm AlSi > Sz s,s 表示 时 点 ， 则 有 : 
Cov] DAY, ' 2 dY, | = >) Ded, Cov(Y, ,Y, ) (2. 2. 6) 


iel j= 


其 本 概念 9 


虽然 方程 〈2. 2. 6) 证 明 繁 琐 ， 但 仅仅 是 直接 应 用 了 期 望 的 线性 性 质 ， 作 为 它 的 一 个 特例 ， 
可 得 如 下 为 人 熟知 的 结果 ， 
Varf DeF, ] 7 Deavarcy, +29) 3 cryCov(Y, Y, ) C2 


i=? j= 


随机 游 动 
令 ea，e ，… 为 均值 为 0， 方差 是 of 的 独立 同 分 布 的 随机 变量 序列 ， 观 测 时 间 序 列 {Y,: t= 
l, 2, see} 构造 如 下 : 


Y, — Êj) 
Y: = el + 
ERA (2. 2. 8) 
Y, = e te teete 
也 可 写成 : 
Y, = Yui te, C23 0.) 


其 “初始 条 件 ”Y 一 e 如 果 把 e 解释 为 沿 数 轴 〈 前 向 或 后 向 ) 游 动 的 “ 步 长 ”的 大 小 ， 那 么 
Y, 就 是 在 时 刻 上,“ 漫 步 者 ”到 达 的 位 置 ， 根据 方程 〈2. 2. 8)， 得 到 均值 孙 数 : 
m = ECY,) = Ele; +e, +e +e) = E(e) 十 Eee) 十 … 十 E(e) 一 0 十 0 十 … 十 0 
因而 ， 对 所 有 的 t, 
u, = 0 (2. 2. 10) 
还 可 以 得 到 ; 
Var(Y ) = Var(el te, +° +e) = Var(e,) 十 Var(ez) 十 … 十 Var(e') =o toi +t +o 
故 有 
Var(Y,) = ta? (2. 2.11) 
注意 随机 过 程 的 方差 随时 间 线 性 地 增长 . 
为 了 了 解 协 方差 函数 ， 假 设 1 委 皮 s， 那 么 可 以 得 到 : 
y,, = Cov(Y,,Y,) = Cove, +e: to + esei te, to te, teri +o +e) 
由 方程 (2.2.6), RNA: 
ha = >. > ,Cov(eiyej) 


i=l j=l 


BÆ, KRT i=j 以 外 ， 协 方差 都 为 0， 当 一) 时 ， 协 方差 等 于 Valeo. RANMA LT, 


因此 Y. = to. 
因为 y ,=y，， 故 在 所 有 时 点 上 和 E, TURE ADTERR, WA: 
Yans = toes [Kts CRBS) 
易 得 随机 游 动 的 自 相 关 函 数 为 : 
he Tepes (2. 2. 13) 
F M Yet ss a 


下 面 的 数值 有 助 于 对 随机 游 动 行为 的 理解 . 


l 
pm = |z = 0-707 - ms =$ = 0.943 
|24 /1 
24,25 一 25 = 0, 980 ,25 一 75 = 0. 200 


随 着 时 间 的 推移 ， 相 邻 时 点 上 Y (EA IE ASC EE RR GR. TT. AB ae 
的 Y 值 ， 其 相关 程度 越 来 越 弱 . 

一 个 模拟 的 随机 游 动 见 图 表 2-1, EP e 采样 自 某 标准 正 态 分 布 ， 值 得 注意 的 是 ， 尽 管 在 
所 有 时 点 上 ， 理 论 均值 函数 值 均 为 0， 但 方差 随时 间 增 长 ， 并 且 过 程 在 相 邻 时 点 上 的 取 值 间 的 
相关 系数 接近 1]， 这 些 事实 说 明 ， 应 预期 该 过 程 将 会 在 远离 零 均值 水 平 处 游 飞 . 

对 于 从 普通 的 股票 价格 波动 ， 到 液体 中 悬浮 微粒 的 位 置 所 谓 的 布朗 运动 等 分 布 领域 广泛 的 众 
多 现象 而 言 ， 简 单 的 随机 游 动 过 程 提供 了 一 个 很 好 的 模型 〈 至 少 在 首次 逼近 的 意义 上 ). 


图 表 2-1 随机 游 动 时 间 序 列 图 


随机 游 动 


0 10 20 30 40 50 60 
时 间 


> win.graph (width=4.875, height=2.5,pointsize=8) 
> data(rwalk) # rwalk contains a simulated random walk 
> plot (rwalk,type='o',ylab='Random Walk') 


滑动 平均 
举 第 二 个 例子 ， 假 设 Y.) 构造 如 下 : 
Y, 一 eten (2. 2. 14) 


其 中 〈 本 书 均 采 用 同样 的 假定 ) 假设 e 均值 为 0, 方差 是 ct， 独立 同 分 布 ， 这 里 : 


ge EF ery a Ele,) + Ele) 0 
<n a ae 


u = E(Y,) = E| 
_ Var(e,) + Varlen) _ 0. 50 


Var(Y,) = Var{ 45) i 


并 且 ， 


Cov(Y， 9 1) — Cov| €: Tfn PE + EC; 一 2 | 


2 


kine 1 
_ Covtle, +Ê] ) + Cove, s€,-2) + Cove, 1 „ê Cove, 1 ea ) 
(因为 其 他 所 有 的 协 方差 为 0) 


_ Covleirenm) 
4 


= 0, 259° 
或 者 对 所 有 的 t, 
Yam = 0. 250? (2.4. 15) 
进一步 ， 有 
C e Feni ee 十 ea __ ? 
ov(Y, Yna) = Cov 47, EEr) 一 0 《因为 e 相 互 独立 ) 


类 似 地 ， 对 k>1, Cov(Y,; Y-2)=0; 因此 可 以 写 为 : 


0. 5cr lt—s|=0 
ro = fot It—s|=1 


0 lt—-s|>1 
对 自 相关 函数 ， 有 : 
1 le—s|=0 
n= fo |ż—s|=1 (2.2. 16) 
0 1 一 引 | 人 1 


这 是 因为 0. 25ce /0. 502 一 0. 5. 

注意 p21 二 03.2 5 oaa T ps TO. 9. 无 论 何 时 出 现 ， 间 隔 一 个 单位 时 间 的 Y 值 之 间 具 有 完全 
相同 的 相关 系数 .此 外 ，psii 二 pz 二 pw-:， 并 且 更 一 般 地 ， 对 所 有 的 :， 都 有 pe* 相 等， 这 就 
引出 了 一 个 重要 的 平稳 性 的 概念 . 


2.3 平稳 性 


根据 观测 记录 对 随机 过 程 的 结构 进行 统计 推断 时 ， 通 常 必须 对 其 做 出 某 些 简化 的 〈 大 致 合 
理 的 ) 假设 ， 其 中 最 重要 的 假设 即 是 平稳 性 ， 平 稳 性 的 基本 思想 是 ， 决 定 过 程 特性 的 统计 规律 
不 随 着 时 间 的 变化 而 变 ， 从 一 定 意义 上 说 ， 过 程 位 于 统计 的 平衡 点 上 . 特别 地 ， 如 果 对 一 切 时 
He k AU KA tis te stts tas 都 有 有 Y. 3 Yi i. Y, 与 Y -rs Ts ky Y, -的 联合 分 布 相同 ， 则 
称 过 程 (Y) 为 严 平稳 的 . 

因此 当 n=1 时 ， 对 一 切 上 和 &，Y, 的 〈 单 变量 ) 分 布 与 Y,-, 的 相同 ， 换言之，Y 具有 相同 
的 〈 边 际 ) 分 布 ， 进 而 ， 对 一 切 上 入， 有 E(Y,) 一 下 (Y，_*)， 因 此 均值 函数 恒 为 常数 ， 另 外 ， 
waa tek, 有 Var(Y,) 王 Var(Y, _) ， 因 而 方差 也 恒 为 常数 ， 

在 平稳 性 的 定义 中 ， 令 n= 二 2， 则 可 看 出 Y, AY, 的 二 元 分 布 必 与 了 -ee 和 YY- 的 二 元 分 布 相 
同 ， 从 而 对 一 切 ct, s Mk 有 Cov(Y,, Y,)=Cov(Yi4, Yiu). $ k=s, HO kst, WA: 

y,, = Cov(Y,,,Yo) = Cov(Yo YO = Cove Y ma) = Yoe 
BUY, 和 YY, 的 协 方差 对 于 时 间 的 依赖 只 与 时 间 间 隔 | t 一 s | 有 关 ， 而 与 实际 的 时 刻 上 和 s ER. 
因此 对 平稳 过 程 可 以 简化 符号 ， 记 为 : 
Ya =Cov(Y, Ya); pt = Corr(Y,.¥—) (2.3. 1) 
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再 注意 到 
a= 
方程 (2.2.5) 给 出 的 一 般 性 质 即 成 为 : 
Yo = Var(Y,) mo =1 
Ye = Y- Pr = p- i (2. 3. 2) 
|Y |S Y lox |< 1 
R-II” Fie, FARRAR AZ. IAHI ARAE RR TB) oe RE. 
一 个 类 似 严 平稳 但 在 数学 上 更 弱 些 的 定义 如 下 : 一 个 随机 过 程 LY.) RAB (或 者 二 阶 
i) 平稳 的 条 件 是 : 
1. 均值 函数 在 所 有 时 间 上 恒 为 常数 . 
2. Yi 二 Yow， 对 所 有 的 时 间 上 AF a k. 
在 本 书 中 ， 每 当 单 独 提 及 平稳 概念 时 ， 通 常 指 的 都 是 弱 平 稳 ， 但是， 如 果 过 程 的 联合 分 布 
族 都 是 多 元 正 态 分 布 ， 那 么 可 以 证 明 这 两 个 定义 是 一 致 的 ， 对 平稳 过 程 ， 通 党 只 考虑 & 之 0. 
A aR 
平稳 过 程 中 一 个 很 重要 的 例子 是 所 谓 的 白 噪 声 过 程 ， 定 义 为 独立 同 分布 的 随机 变量 序列 
{e}，、 其 重要 性 并 非 源 自 它 是 有 趣 的 模型 ， 而 是 因为 许多 有 用 的 过 程 可 由 日 品 声 过 程 构造 出 
来 . BR (e) 是 严 平 稳 的 ， 因 为 : 
Prle, S Tise, S Te S Ta) 
= Pr(e, <S zi)Pr(e。 S z:)* Prle, Sz) (根据 独立 性 ) 
= Pr(e, 4 < 21) Pr(e,-« S z2) Prle, ~ S Ta) ( 同 分 布 ) 
= Pr(e -r S Ti renr S Erst se, -r S Tn) 《根据 独立 性 ) 
正如 定义 的 要 求 . FA, =E) BER, A 
E Varle,) k=0 
| os l k #0 
另外 还 可 以 写成 : 
l k=0 
amt, oe (2. 3. 3) 
白 品 声 这 一 术语 来 自 于 如 下 的 事实 ， 即 对 模型 的 频 域 分 析 表 明 ， 与 白光 的 情形 类 似 ， 模 型 中 
平等 地 包含 了 所 有 的 频率 . 我 们 通常 假设 白 噪 声 过 程 具 有 0 均值 ， 且 记 方 差 Var(e,) Hot. 
2. 2 节 滑 动 平 均 的 例子 (其 中 Y= 二 (e, 十 e,-1)/2) 是 又 一 例 用 白 品 声 构 造 的 平稳 过 程 ， 这 
里 用 新 的 符号 表示 该 滑动 平均 过 程 为 
1 k=0 
pr ye Ik&|=1 


0 Ik| 宇 2 
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随机 余弦 波 
这 里 举 一 个 稍 有 不 同 的 例子 2 ， 考 虑 如 下 和 定义 的 一 个 过 程 ， 
Y, = cos| 2x (15 +8) | EEN eo ee oe eee 
Hpo RER 选 自 区 间 0 到 1 上 的 均匀 分 布 ， 由 于 立 每 经 过 12 个 时 间 单 位 等 值 重复 自 
身 一 次 ， 所 以 得 自 该 过 程 的 样本 会 显 出 高 度 的 确定 性 ， 并 且 看 似 一 个 完美 的 〈 离 散 时 间 ) 余弦 
曲线 ， 但 是 ， 过 程 的 最 大 值 并 不 发 生 在 上 =0 时 ， 而 是 由 随机 相位 下 决定 .相位 下 可 解释 为 到 
1 一 0 时 刻 ， 一 个 完整 的 循环 已 完成 的 部 分 .该 过 程 的 统计 性 质 可 计算 如 下 : 


| aa a tl aaa 


l 
= 去 | sin( 2x ip + 2x) — sin( 2m iz) | 
HAEREA, APA ESR OO. AEX A la] t， jp 二 0. 
同时 ， 


=f 


Yun = E( cos[ 2x( 75 +) Joos] 2n( 35 +2) ] 


bole pole mle = 
a mmi 


{ cos| 2x( 2) | +n 2x( 与 于 +28) | 
| 


因此 该 过 程 平稳 ， 具 有 自 相 关 函 数 
pr = cos( 2n 35)? k=0,+1, 42, (2.3. 4) 


该 例 表明 ， 对 给 定 的 时 间 序 列 ， 仅 基于 观测 数据 的 时 间 序 列 图 难以 评估 平稳 性 是 否 为 一 个 
合理 的 假设 . 

2. 2 节 中 同样 自白 噪声 构造 得 到 的 随机 游 动 (其 中 YY, 二 el 十 ez 十 … 十 e:)〉 却 不 是 平稳 的 . 
例如 ， 方 差 函 数 Var(Y,) 一 如 就 不 是 常数 ; 更 进一步 ， 协 方差 函数 7, 二 to? Orcs) 也 不 仅 
仅 依 赖 于 时 灌 ， 但 假如 不 直接 分 析 {Y,}， 而 是 考虑 相继 产值 的 差分 ， 用 VY, RR, WAVY S= 
Y,—Y, =e, 从 而 差分 后 的 序列 (VY) 是 平稳 的 .这 代表 了 在 许多 应 用 中 极为 有 用 的 一 种 技 
巧 的 简单 示例 .显然 ， 由 于 许多 实际 的 时 间 序 列 ， 不 是 处 于 统计 上 的 平衡 状态 ， 而 是 随时 间 变 
化 不 断 发 展 的 ， 因 此 不 能 用 平稳 过 程 对 它们 进行 合理 的 建 模 . 但 是 ， 经 常 可 以 通过 诸如 差分 这 
样 的 简单 技巧 ， 把 非 平稳 序列 转换 成 平稳 的 序列 ， 在 后 面 的 章节 里 ， 这 类 技巧 将 会 给 我 们 提供 
有 力 的 帮助 


已 ”该 例 所 涉及 的 可 选 痪 料 ， 在 理解 本 书后 妹 太 部 分 内 容 时 并 不 是 必要 的 ， 在 第 13 RHA PHSB. 
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2.4 小 结 


本 章 我 们 介绍 了 作为 时 间 序 列 模型 的 随机 过 程 的 一 些 基 本 概念 .特别 地 ， 至 此 读者 应 该 非 
贡 康 悉 均 值 范 数 、 自 协 方 差 本 数 和 自 相 关 函 数 这 些 重 要 的 概念 了 .为 进一步 说 明 这 些 概 念 ， 我 
们 还 研究 了 一 些 基本 的 过 程 : 随机 游 动 、 白 噪声 、 一 个 简单 的 滑动 平均 和 一 个 随机 余弦 波 ， 最 
后 介绍 的 是 平稳 性 这 一 贯穿 全 书 的 基本 概念 . 


习题 
2.1 (Rig EC(X)=2, Var(X)=9, ECY)=0, Var(Y)=4 和 Corr(X, Y)=0. 25. RR: 
(a) Var(X+Y) 
(b) Cov(X, X+Y) 
Cc) Cort XTY, X—Y) 
2.2 WRX 和 Y 是 相关 的 ， 而 Var(X)=Var(Y), R: Cov(X+Y, X-Y). 
2.3 OXMARHAA p, HHA’, HSY, =X 对 所 有 的 上 均 成 立 . 
Ca) HEAR: (Y,} 是 严 平 稳 和 弱 平 移 的 . 
(b) oR {Y,} 的 自 协 方差 函数 . 
Cc) 简略 地 绘 出 Y “典型 ”的 时 序 图 . 
2.4 令 (e) 为 零 均 值 白 品 声 过 程 ， 假 设 观 测 到 的 过 程 是 Y,=e 十 be,-;， 其 中 0 或 者 是 3， 或 
者 是 1/3. 
(a) 求 出 9=3 和 6=1/3 时 {Y,} 的 自 相关 函数 ， 
(b 至 此 应 已 看 出 ， 无 论 9 取 何 值 ， 时 间 序 列 都 是 平稳 的 ， 且 不 管 0=3 还 是 9 二 1/3， 其 
自 相关 郴 数 都 相同 .为 简单 起 见 ， 假 设 已 知 过 程 Y, 的 均值 是 0, FHI. 观测 
{Y.} 序列 在 上 一 1，2 ,…，, 寻 时 的 值 ， 并 假设 可 以 得 到 对 自 相 关系 数 o 较 好 的 估计 . 
这 时 ， 根 据 ps MH. FERRE ORME (3 或 1/3)? 判断 的 理由 是 什么 ? 
2.5 {Ri Y,=5t2t+X,, HP (X) 是 零 均 值 平 稳 序 列 ， 具 有 自 协 方差 范 数 v. 
(a) 求 {Y,} MRR. 
(b) 求 (Y,) 的 自 协 方差 函数 . 
Cc) {Y,} 是 否 平稳 ?根据 是 什么 ? 
X, 当 上 是 奇数 时 


2.6 B (X) 是 平稳 时 间 序 列 ， 并 且 定义 了 一 | | 。 当 ， eman 


(a) 证 明 对 所 有 的 灌 后 &，Cov(Y,，Y,,) 5 t BX. 
(b) {Y,} 平稳 吗 ? 
2.7 假设 {Y,} 平稳 ， 且 有 自 协 方差 函数 y. 
(a) 通过 求 (W.) 的 均值 和 自 协 方差 函数 ， 证 明 W, =V Y, SY, Yn Fe. 
(b) HEH: U.=WY, =V[Y, = Yea J=¥,—2Y..+Y, EFR. OR WORM (U) 的 均 
值 和 自 协 方差 函数 . ) 
2.8 假设 (Y) 平稳 ， 自 协 方差 函数 是 Y.， 证 明 对 任意 固定 的 正 整数 ”及 任意 常数 c ,cz ，……cv， 
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= 
= 


.11 


. 12 


. 13 


.14 


.15 


.16 


17 


. 18 


如 下 定义 的 过 程 {W,)(W, = aY, 十 co 了 i 十 … 十 cvY_ ,+ ) 是 平稳 的 . (注意 ;习题 2. 7 是 本 

题 结 论 的 特例 . ) 

假设 Y, 二 访 十 Bt 十 X,， 其 中 (X) 是 零 均值 平稳 序列 ， 具 有 自 协 方差 函数 7,， HHE BR 

All By Se Fe RK. 

Ca) W: {Y} 非 平 稳 ， 但 是 W.=VY,=Y,—Y,-. FR. 

(b) 一 般 地 ， 证 明 : 如 果 Y, 二 py 十 X,， 其 中 {X,} 是 零 均 值 平稳 序列 ，m 是 上 的 qd 阶 多 
MA, ABA4 mad ht, VY, =V(V Y, 是 平稳 的 ; 而 当 O<m<d 时 非 平 稳 . 

设 (Xr 是 零 均值 、 单 位 方差 的 平稳 过 程 ， 具 有 自 相 关 函 数 o. 假设 m 为 非常 数 画 数 ， 

o 是 取 值 为 正 的 非常 数 函 数 . 观测 序列 形 如 YY, 二 jp 十 a,X,. 

(a) RA (Y) 的 均值 和 协 方差 函数 . 

(b) 证 明 过 程 (Y) 的 自 相 关 函 数 只 依赖 于 时 沾 ， 过 程 (Y) 平稳 吗 ? 

(c) 是 否 存 在 时 间 序 列 ， 其 均值 为 常数 ， Corr(Y,, Yep) 5 t ER, 而 {Y,} 是 非 平稳 的 ? 

假设 Cov(X,，X,) 二 XX Gt HR, mM ECX,) =3:. 

(a) {X,} 平稳 吗 ? 

(b) &Y,=7—3t+X,, {Y,} 平稳 吗 ? 

(Ri Y, =e, —e,12. WEH: (Y) FPR, F#AROOM, RAM KBAR HS k=12 时 

EF. 

令 Y, 二 e, 一 0(e,-1)*. 这 里 假设 白 噪 声 序 列 是 正 态 分 布 . 

(a) R {Y,} 的 自 相 关 函 数 . 

(b) {Y,} 平稳 吗 ? 

求 下 列 过 程 的 均值 和 协 方差 函数 ， 并 判断 每 种 情况 下 过 程 是 否 平 稳 . 

(a) Y, =b tte. 

(b) W,=VY,, HPy, 由 (a) 给 出 . 

(c) Y,~ee,1. (可 以 假设 (e) 是 正 态 白 噪声 . ) 

假设 X 是 零 均 值 随机 变量 ， 定 义 时 间 序 列 Y, =X. 

(a) 求 {Y,) A (A ew RK. 

(b) 求 {Y,) A PAT 2 wR. 

Cc) {Y,} 平稳 吗 ? 

(it Y,=A+X,, HP (X) 平稳 ， 而 随机 变量 A 独立 于 {X,}. 用 {X,} WHA 

协 方 差 函 数 以 及 A 的 均值 和 方差 ， 求 CY.) 的 均值 和 协 方差 郴 数 . 


令 {Y,} FR, ATR RBH n Y= >) Y., 证明; 
vy 4257, k,l/ lk 
Var(Y) aera? 1s =, ae n (1 )7 


BY.) 平稳 ， 自 协 方差 西数 y. ERA S= D YP. 


(a) 首先 ， 证 明 >) (OY 一 让 := >) YY nY p. 
t=1 t=} 
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(b) FA Ca) 证明 
ES) =n- Var =n > (1 一 至 )y 
(利用 习题 2. 17 的 结果 得 出 最 后 面 的 表达 式 . ) 
(c) 如 果 {Y,) 是 方差 为 yo 的 白 品 声 过 程 ， 证明 ECS ) 一 mm， 
S Y= tes H4 t>1 a, AY.=O+Y.i. +e 来 递 推 地 定义 Y,， 这 里 如 是 常数 . 
则 称 过 程 {Y,} 为 带 漂移 的 随机 游 动 . 
(a) 证 明 Y, 可 以 被 写 为 了 ,一 如 十 e: 十 e-: te +e. 
Cb) SR Y, 的 均值 函数 . 
(c) RY, K BP 2 Pw. 
AG FS bp HE AY BL Rs Y, =Y, +e, Yı =e. 
Ca) 使 用 上 述 Y, 的 表达 式 ， 证 明 在 初始 条 件 p = EC.) =0, tl Hf, w=. 由 此 ， 
证 明 对 所 有 上， 都 有 pa =9~ 
(b) 类 似 地 ， 证 明 1, Var(Y,)=oc8 HY, Var(Y,)=Var(Y,.) +o, Ail Var(Y,)= tó. 
(c) 对 0 过 :二 *， 用 Y,=Y tei ten, te te, 证 明 Cov(Y,，Y,) 一 Var(Y,)， 因 而 有 
Cov(Y,, Y,;)=min(t, sdoi. 
对 有 随机 初始 值 的 随机 游 动 ， 在 t>0 时 ， 4A Y, =Y, te, tei tetes 其 中 Yo 的 分 布 
具有 均值 po. 方差 0. 进一步 假设 Yos Es “so & 是 相互 独立 的 . 
(a) 证 明 对 所 有 t，E(Y,) 二 jo. 
(b) WEAR Var(Y, ) =to? 十 ol. 
(c) 证 明 Cov(Y,, Y,)=min(t, s)oi +o. 


、 = Ita, +05 
(d) 证 明 对 O<t<s, Corr(Y,, Y,) eae 


A {e,} 是 零 均 值 的 白 品 声 过 程 ， 并 令 c 为 满足 jc| 到 1 MRR. EEEN Y, AY. = 
cY_ tes EP Y Se. 

(a) 证明 ECY,)=0. 

(b) 证 明 Var(Y,) =o2 (ite? tettette. Y, 平稳 吗 ? 


(Cc) 证 明 
_ a /Var(Y.:) 
Corr(Y,,Y, 1) =c ar) ， 对 有 & 二 0 


提示 : 先 证 明 Y， ,与 e 独立 ， 再 利用 
Cov(Y Y1) = Cov(cY, i 十 es mı) 


2 
Var(Y,) =~ Si 和 Corr(Y, Y) ~c*, MRk>OO 


] 一 ec: 
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.23 


.24 


.25 


.26 


.27 


. 28 


29 


因此 可 以 称 CY.) 为 渐 近 平稳 的 . 
(e) | 设 改变 AE, 4 Y,=—L_..,, 证 明 这 时 (Y, l 
e) 现在 假设 改变 了 初始 条 件 ， 并 且 令 万 二 于 证 明 这 时 CY.) 平稳 
如 果 对 任意 时 点 ty ote eet stm 和 Siys，…s， 随机 变量 { 2, »Z,, geet Ly ) 与 随机 变量 
CY, Yne Y, ) 都 相互 独立 ， 则 称 这 两 个 过 程 (Z) 和 {Y,) 独立 ， 证 明 如 果 {2,) 
和 {Y,) 是 独立 的 随机 过 程 ， 那 么 W= +Y, 是 平稳 的 . 
令 (X) 是 我 们 感 兴趣 的 时 间 序 列 . 但 由 于 测量 过 程 并 不 完善 ， 实 际 观 测 到 的 是 Y= 
X,te,. 假设 (X) 和 (e) 是 相互 独立 的 过 程 ， 称 X, 为 信号 ，e, 为 测量 噪声 或 误差 
过 程 . i 
如 果 (X) 是 平稳 的 ， 具 有 自 相 关 函 数 o, WA {Y,} 也 是 平稳 的 ， 且 有 


Corr( 刀 ,7 二 一 此 7， 对 k 宇 1 
1l+o/ox 
我 们 称 o/o AME “SNR)， 值 得 注意 的 是 ，SNR 越 大 ， 观 测 过 程 {Y,} 的 自 相 关 
函数 与 目标 信号 (X) 的 自 相关 函数 越 接近 . 
(Rik Y,=— + >) [Aicos(2nfit)+Bsin(2nfit)], HP Bsfirfors fs BAR, A» 


Az s**t ,A s Bi Bak 是 相互 独立 且 均 值 为 零 的 随机 变量 ， 方差 Var(A;) = Var(B;) =ø. 
求证 (Y) 是 平稳 的 ， 并 求 其 协 方差 图 数 . 


定义 函数 ,= 直 E[L(Y, 一 Y,)*]， 在 地 质 统计 学 中 ，., 称 为 半 方 着 本数. 


Ca) 证 明 平 稳 过 程 有 TT,, 二 Yo 一 7 1-51 - 
(b) 如 果 过 程 的 卫 ., 仅 依赖 时 间 差 | :一 s | ， 则 称 其 为 本 质 平 稳 的 .证 明 随 机 游 动 过 程 
是 本 质 平稳 的 . 
对 固定 的 正 整数 r 和 常数 点 ， 考 虑 定义 为 Y,=e 十 ge 十 内 e-:* 十 … 十 风 e- 的 时 间 序 列 . 
(a) 证 明 对 #$ 的 任意 取 值 ， 过 程 都 是 平稳 的 . 
(b) RA A MK wR. 
(扩展 的 随机 余弦 波 ) 假设 ， 
Y, = Reos(2x( ft +®)), 上 一 0, 士 1 £2; 


其 中 0 二 /二 二 是 固定 的 频率 ，R 和 中 是 不 相关 的 随机 变量 ，@ 服从 《0，1) 区 间 上 的 


均匀 分 布 . 
(a) 证 明 对 所 有 to ECY) =0. 


(b) 证 明 该 过 程 是 平稳 的 ， H n= ECR’ )cos(2n fk). 


提示 : 利用 导出 方程 (2.3.4) 的 算法 . 
(进一步 扩展 的 随机 余 弦 波 ) 假设 


Y, = X R;cos[2x( fit +O), t=0,+1, £42; 
j=l 
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其 中 0<fi<fr<< fa < Gh m 个 固定 的 频率 ， 并 且 R; +P, ‚Rz » D2 5°" R,, ;Dn 是 不 相 


关 的 随机 变量 ,每 个 p 服从 (0，1) 区 间 上 的 均匀 分 布 . 
(a) 证 明 对 所 有 t，E(Y,) 二 0. 


(b) 证 明 该 过 程 是 平稳 的 ,是 n= D) ECR) cos(2n fk). 


提示 : 先 做 习题 2. 28. 
(需要 数理 统计 知识 ) 假设 

Y, = Rcos[2z( ft +O) ], t=0,+1, £2, 
Ftp R Al JAA ABLE, f 是 固定 的 频率 .假设 相位 ARMA (0，1) 上 的 均匀 分 
布 ， 振 幅 R 服从 瑞 利 分 布 ， 对 +0， 其 概率 密度 分 布 (pdf) frr. 证 明 在 每 个 时 点 
t, Y, 服从 正 态 分 布 ，( 提 示 : 4 Y=Reos[2x( ft+)], X=Rsin[2n(ft+@®]. RX AY KH 
联合 分 布 ， 还 可 以 证 明 ， 所 有 的 有 限 维 分 布 都 是 多 元 正 态 分 布 ， 因 此 该 过 程 是 严 平 稳 的 . ) 


HRA 期望、 方差 、 协 方差 和 相关 系数 


本 附录 中 ， 我 们 将 定义 连续 随机 变量 的 期 望 . 但 是 ， 这 里 描述 的 所 有 性 质 对 于 各 类 随机 变 
量 都 成 立 ， 无 论 它 是 离散 的 、 连 续 的 ， 或 者 其 他 的 类 型 . OX 具有 概率 密度 函数 f(x)， 并 且 
S (X, Y) 对 具有 联合 概率 密度 汞 数 f(z, y). 


定义 X 的 期 望 值 为 : ECX)= | eFC dd. 


一 cm 


(如 果 | |z|f(z)dr 二 oo; 否则 E(X) 无 法 定义 . ) E(X) EKA X 的 期 望 ， 或 X 的 均 


a; 并 且 经 常 记 为 H 或 wx， 
期 望 的 性 质 


如 果 函 数 A(z) 满足 | 1A(z) | fCz)dz<co， 则 可 以 证 明 


E[ACX)] = | a(x) fade 


类 似 地 ， 如 果 | | [A »| fla, ydedy<co, ALLE 


一 co 一 co 


Se co 


E[h(X,Y)] = | | ace.) fla, yardy (2. A. 1) 


一 DODD 一 CD 


作为 方程 (2. A. 1) 的 推论 ， 容 易 得 到 如 下 重要 结论 : 


还 有 


E(aX + 6Y +c) = aE(X) + bECY) +c (2. A. 2) 
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ECXY) = | | zyf (zy dzrdy (2. A. 3) 
随机 变量 X 的 方差 定义 为 : 
Var(X) = E{LX — E(X) }*} (2. A. 4) 
(只 要 ECX’) FE). X 的 方差 经 常 记 作 ec: M ok. 
方差 的 性 质 
Var(X) >0 (2. A. 5) 
Varla + 6X) = Var(X) (2. A. 6) 
如 果 和 与 了 相互 独立 ， 那 么 
Var(X 十 Y) = Var(X) 十 Var(Y) (2. A. 7) 
一 般 地 ， 可 以 证 明 : 
Var(X) = E(X?) — (EC(X)}? (2. A. 8) 


方差 X 的 正 数 平方 根 称 为 X 的 标准 差 ， HHRH o Rox. 随机 变量 (X 一 jxx)/ox KAX 的 标 
准 化 形式 .分别 地 ， 标 准 化 变量 的 均值 和 标准 差 总 是 0 和 1. 
X 5Y ABE MA Cov(X, Y=EMX— py) (¥—py) J. 


协 方差 的 性 质 
Cov(a + 6X ,c + dY) = bdCov(X,Y) (2. A. 9) 
Var(X +Y) = Var(X) + Var(Y) + 2Cow( X,Y) (2. A. 10) 
Cov(X + Y,Z) = Cov(X,Z) + Cov(Y,Z) (2. A. 11) 
Cov(X,X) = Var(X) (2. A. 12) 
Cov(X,Y) = Cov(Y,X) (2. A. 13) 
mR XY AAAI, 那么 
Cov(X,Y) = 0 (2. A. 14) 
X 5 Y 的 相关 系数 用 Corr(X, Y) 或 者 p 表 示 ， 定 义 如 下 : 
p = Corr(X,Y) = -Covte 
VVar(X)Var(Y) 


Hop, WX EX 标准 化 后 的 变量 ，Y" 是 了 标准 化 后 的 变量 ， 则 p 二 E(X*Y*). 
相关 的 性 质 


— 1 < Corr(X,Y) <1 DEA TI] 
Corr(a + bX ,c + dY) = sign(bd)Corr(X,Y) 
1 # bd 二 0 
其 中 sign(az) = 20 # bd =0 (2. A. 16) 
g 1 #bd<0 


Corr(X, Y)=+1 的 充 要 条 件 是 ， 存 在 常数 a Mb, HH Pr(Y 一 a 十 5X) 一 1. 


第 3 章 趋 势 


一 般 时 间 序 列 的 均值 函数 是 完全 任意 的 时 间 婧 数 . 平稳 时 间 序 列 的 均值 函数 一 定 是 时 域 上 
的 常数 ， 通 常 需要 站 在 中 间 的 立场 上 考虑 相对 简单 的 时 域 均值 函数 (但 不 是 常数 )， 本 章 研 究 
这 类 趋势 . 


3.1 确定 性 趋势 与 随机 趋势 


“趋势 ”可 能 是 难以 琢磨 的 ， 同一 个 时 间 序 列 在 不 同 的 分 析 者 看 来 可 能 非常 不 同 ， 图 表 2-1 
中 模拟 的 随机 游 动 过 程 可 以 看 做 具有 一 个 普通 的 上 升 趋势 . 然而 ， 我 们 知道 随机 游 动 过 程 在 
任何 时 间 上 都 有 零 均 值 ， 在 相 邻 时 点 上 序列 值 存在 很 强 的 正 相 关 ， 并 且 随 机 过 程 的 方差 随时 
间 的 增加 而 增加 ， 表 面 上 的 趋势 只 是 因此 得 到 的 产物 ， 对 完全 一 样 的 过 程 进 行 第 二 次 和 第 三 
次 的 模拟 可 能 展现 完全 不 同 的 “趋势 ". 练习 中 ， 我们 要求 你 进行 额外 的 模拟 .有 些 作 者 把 
这 样 的 趋势 称 为 随机 趋势 ( 见 Box, Jenkins 和 Reinsel, 1994), 尽管 还 没有 被 普遍 接受 的 随 
机 趋势 的 定义 ， 

图 表 1-7 所 绘制 的 月 平均 气温 序列 显示 出 周期 性 的 或 季节 性 的 趋势 ， 存 在 这 个 趋势 的 原因 
很 明显 一 一 北半球 对 太阳 的 倾斜 度 不 断 变 化 ， 这 种 情况 下 ， 一 个 可 能 的 模型 是 Y, 二 jy, 十 X,， 其 
中 jp 是 具有 周期 12 的 确定 函数 ， 即 pee 应 该 满足 

Ht = fries 对 所 有 

我 们 可 以 假设 围绕 jy, 无 法 观测 到 的 扰动 XX, 对 所 有 的 上 都 有 零 均值 ， 因 此 ， 实 际 上 jy, 是 观测 序 
列 Y, 的 均值 函数 . 与 之 前 讨论 的 随机 趋势 相 比 ， 我 们 可 以 把 这 种 模型 描述 成 具有 确定 趋势 . 
其 他 情况 下 ， 我 们 可 以 假设 确定 趋势 关于 时 间 是 线性 的 《〈 即 aSa taD, RERA LSK h 
势 ， 即 n=R+Bitee. ER, A Y, = HX 对 所 有 的 上 都 有 E(X) 一 0， 这 意味 着 在 任何 时 
间 都 有 确定 趋势 u. AU, WR py 二 镶 十 Bt:， 我 们 假设 相同 的 线性 时 间 趋 势 一 直 适 用 .因此 ， 我 
们 应 该 有 合理 的 理由 来 假设 这 样 的 模型 一 一 不 仅仅 是 因为 在 观测 期 内 序列 看 上 去 是 线性 的 . 

本 章 我 们 考虑 为 确定 趋势 建 模 的 方法 ， 随 机 趋势 将 在 第 5 章 讨 论 ， 随 机 季节 模型 会 在 第 
10 章 讨 论 ， 很 多 作者 都 仅仅 用 趋势 代表 缓慢 变化 的 均值 函数 ， 比 如 线性 时 间 趋 势 ， 并 用 术语 
季节 项 表示 周期 变化 的 均值 函数 . 这 里 ， 看 得 出 作 此 区 分 没有 多 少 意义 . 


3.2 常数 均值 的 信 计 


我 们 首先 来 考虑 简单 的 情况 ， 假 设 均值 函数 是 常数 ， 因 此 ， 模 型 可 以 写 为 
Y, =u+X, RRA 


其 中 对 所 有 的 :有 E(X,) 二 0。 Fe ASIA APY, ,Y; ,…,Y, 来 估计 pj， 最 第 用 的 
u 的 估计 是 样本 均值 或 平均 数 ， 定义 为 
| y=i>y, (3. 2. 2) 


在 对 方程 (3. 2. 1) 最 少 的 假设 下 ， 可 以 看 出 EY) =p, Bi, Y Ee 的 无 偏 估 计量 . 为 


as 4 l 2] 


了 得 到 Y 作为 的 估计 量 的 精确 度 ， 我 们 需要 对 OX, 做 进一步 的 假设 . 

假设 (Y,} (或 等 价 地 ， 方程 3.2.1) 中 的 (X,;》 是 平稳 时 间 序 列 ， 具 有 自 相关 函数 o. 
那么 根据 习题 2. 17， 我 们 知道 

Var(Y) = a| Os (3 _ ikl oe | = Aria -že ] (3. 2. 3) 

注意 ， 第 一 个 因子 yun 是 随机 过 程 的 Tvs 方差 除 以 样本 容量 一 一 是 在 简单 随机 抽样 下 我 
们 熟悉 的 概念 ， 如 果 方 程 (3. 2. 1) 中 的 序列 (X) BIRARE, BAMA ROO a0, 
并 且 Var(Y) 变 成 简单 的 yo /nm. 

E CEH) aia mi -1， 我 们 得 到 pj = 二 一 0. 4， 并 且 对 所 有 二 1 有 aF 
0. 在 这 种 情况 下 ， 有 


Yo l o Yo nal 
Var(Y) = mi tt(I~ 7G) ] = alt 9 8 = ) | 
对 于 在 时 间 序 列 中 通常 的 n 值 (例如 nn 二 50)， 因 子 (n 一 1)/n 会 接近 于 1， 因 此， 我 们 得 到 
Var(Y) ~ 0.2 7 

我 们 看 到 相对 于 白 噪 声 〈 随 机 抽样 ) 情况 ，1 阶 滞后 的 负 相关 改进 了 均值 的 估计 ， 因 为 序列 赵 
于 围绕 均值 前 后 摆动 ， 所 以 获得 的 样本 均值 更 精确 . 

另 一 方面 ， 如 果 对 所 有 RS 有 wm 全 0， 那么 从 方程 .(3. 2. 3) 可 以 看 出 Var(Y) 将 会 大 于 
yo/n， 此 时 正 相 关 性 使 得 对 均值 的 估计 比 在 白 品 声 情况 下 更 困难 . 一 般 地 ， 有 些 是 正 相 关 ， 有 


些 是 负 相 关 ， 所 以 需 使 用 方程 (3. 2. 3〉 来 评估 总 的 效应 ， 
很 多 平稳 过 程 随 着 滞后 的 增加 ， 自 相关 函数 迅速 衰减 ， 即 


DS lal<a (3. 2. 4) 
k=0 


(第 2 章 的 随机 余弦 波 是 例外 . ) 
在 假设 方程 (3. 2. 4) 和 给 定 的 充分 大 的 样本 容量 n 下， 从 方程 (3. 2. 3) 可 以 得 到 下 面 有 


用 的 近似 (例如 ， 参 阅 Anderson, 1971, 459 页 ) 
VarP ~ Di |: n 充分 大 (3. 2. 5) 


ER. BRIM, WHESHAR Sn 成 反比 . 
例如 ， 假 设 对 所 有 上 有 pi 一 $1*' ， 其 中 $$ 严格 介 于 一 1 与 1 之 间 ， 等 比 序列 求 和 得 到 


TA a (1 -+#)y 
人 (3. 2. 6) 


对 于 非 平稳 过 程 (但 是 有 常数 均值 );， 作 为 y 的 估计 量 的 样本 均值 的 精确 度 会 非常 不 同 . 
作为 一 个 有 用 的 例子 ,假设 方程 (3. 2.1) 中 (X) 是 如 第 2 章 描 述 的 随机 游 动 过 程 ， 那么 
从 方程 (2.2.8) 可 以 直接 得 到 

Var(Y) = val OY, ] = Lvaf > De] 


i=] j=] 


L Varle, 十 2e +3es +: + ne.) = D 


ka 


所 以 


Var(Y) = oi(2n + 1) (3. 2. 7) 


注意 ， 在 这 个 特例 中 ， 均 值 估 计量 的 方差 实际 上 随 样 本 容量 n 的 增加 而 增 太 .显然 ， 这 是 不 可 
接受 的 ， 对 非 平 稳 序 列 ， 我 们 需要 考虑 其 他 佑 计 方 法 . 


3.3 回归 方法 

传统 的 回归 分 析 统 计 方 法 可 以 用 来 方便 地 估计 一 般 的 非常 数 均值 趋势 模型 的 参数 . 我 们 将 
介绍 最 有 用 的 几 种 : 线性 趋势 、 二 次 趋势 、 季 节 性 均值 趋势 和 余 汞 趋势 . 

时 间 的 线性 趋势 和 二 次 趋势 

考虑 如 下 的 确定 时 间 超 势 ， 

pe = Pp tft (3.3.1) 

Hh B 和 BB 分 别 代表 斜率 和 截 距 ， 是 未 知 的 参数 .选择 古典 最 小 二 冬 (或 回归 )〉 ER A 
Al 的 值 ， 该 方法 最 小 化 


Qf) = Py, — (B + Bt) J? 


求解 方式 有 好 几 种 ， 例 如 ， 通 过 计算 关于 两 个 8 的 偏 导数 ， 使 偏 导 数 等 于 零 ， 并 且 求 解 得 到 的 
关于 8 的 线性 方程 组 .用 有 & MA 表示 得 到 的 解 ， 我们 有 


SY, — Y) — T) 


t=] 
Na- 


Ê =Y—Bt CEES 
其 中 f= (n 十 1)/2 是 1,2,…,n 的 平均 数 . 这 些 公式 可 以 被 稍微 简化 ， 而 且 这 些 简 化 的 公式 
也 都 为 人 所 熟知 ， 然 而 ， 我 们 假设 计算 可 以 由 统计 软件 完成 ， 在 此 不 再 探讨 名 和 有 的 其 他 
BIRR. 
示例 
考虑 展现 在 图 表 2-1 中 的 随机 游 动 过 程 ， 假 如 〈 错 误 地 ) 把 它 当 成 线性 时 间 趋 势 并 通过 最 
小 二 乘 回归 法 估计 其 斜率 和 截 距 ， 应 用 统计 软件 得 到 图 表 3-1. 
图 表 3-1 线性 时 间 趋 势 的 最 小 二 乖 回 归 估 计 


A= 


”估计 ip METRE t 值 P> fep 
WIE — 1. 008 0. 2972 一 3, 39 0. 001 26 
时 间 0.1341 Ô. 008 48 15. 82 <0. 0001 


> data (rwalk) 
> modelil=lm(rwalk-time (rwalk) } 
> summary (modell) 
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He Ab fei Ht AY BY REAREA SH EB, =0. 1341 HB, = —1. 008. 图 表 3-2 MAT EOY AIFS 
加 了 最 小 二 乘 回归 趋势 线 . 稍 后 ， 我 们 将 在 3.5 节 进 一 步 分 析 回 归结 果 ， 并 发 现 用 直线 来 拟 合 
这 些 数据 是 不 恰当 的 . 


图 表 3-2 随机 游 动 与 线性 时 间 趋 势 


时 间 


> win.graph(width=4.875, height=2.5,pointsize=8) 
> plot (rwalk, type='0',ylab='y') 
> abline (model1) # add the fitted least squares line from modell 


周期 性 或 季节 性 趋势 

现在 考虑 对 季节 性 趋势 进行 建 模 和 估计 ， 比 如 图 表 1-7 中 的 月 平均 气温 数据 ， 此 处， 我 们 
假设 观测 到 的 序列 可 以 表示 为 

Y, = mu +X, 

其 中 ， 对 所 有 t, ECX,)=0. 

对 月 度 季 节 性 数据 ， 对 六 最 常用 的 假设 是 存在 12 个 常数 (BRO B ,Be，… ,Bz， 它 们 给 出 
了 12 个 月 每 月 的 期 望 平 均 气 温 ， 我 们 可 以 记 为 

B 上 一 1,13,25,，…. 
一 $ E (3.3. 3) 


Bs t= 12,24,36, 

该 模型 有 时 被 称 为 季节 均值 模型 . 

作为 该 模型 的 一 个 例子 ， 考 虑 展示 在 图 表 1-7 中 的 月 平均 气温 数据 ， 为 拟 合 该 模型 ， 需 要 
构造 指针 变量 〈 有 时 也 称 为 虚拟 变量 ) 以 表明 每 个 数据 点 所 属 的 月 份 . 完成 这 一 过 程 依赖 于 你 
使 用 的 特定 的 统计 软件 ， 还 需要 注意 的 是 ， 所 述 模型 不 包含 截 距 项 ， 软 件 也 需要 了 解 这 点 ,性 
外 ， 我 们 可 以 使 用 截 距 项 ， 但 要 删 去 方程 〈3. 3. 3) 中 的 任何 一 个 有 

图 表 3-3 展示 了 对 气温 数据 拟 合 的 季节 均值 模型 的 结果 .此 时 ， 报 告 中 的 上 值 和 Pr(> lel) 
值 都 没有 多 大 意义 ， 因 为 它们 都 与 检验 零 假 设 BETS (此 时 并 非 是 个 有 意义 的 假设 ) 有 关 . 


图 表 3-3 ”季节 均值 模型 回归 结果 


fi it 标准 误差 t (4 Pr(> |:|) 
1 月 16. 608 0. 987 16.8 一 0. 0001 
2 月 20. 650 0. 987 20. 9 <0, 0001 
3 月 32. 475 0. 987 32.9 <0. 0001 
4 月 46. 525 0. 987 47.1 <0. 0001 
5 月 58. 092 0. 987 58. 9 <0. 0001 
6 月 67. 500 0. 987 68. 4 一 0.0001 
7 月 71.717 0. 987 72.7 <0. 0001 
8 月 69. 333 0. 987 70. 2 <0. 0001 
9 月 61. 025 0. 987 61.8 <0. 0001 
10 月 50. 975 0. 987 51.6 <0. 0001 
11 月 36. 650 0. 987 37. 1 <0. 0001 
12 月 23. 642 0. 987 24.0 | <0. 0001 

data (tempdub) 


month.=season(tempdub) # period added to improve table display 
mode12=1m(tempdub~month.-1) # -1 removes the intercept term 
summary (mode12) 


Vv v v 


图 表 3-4 显示 了 我 们 拟 合 的 模型 包括 截 距 项 时 结果 是 如 何 变 化 的 .此 时 ， 软 件 去 掉 了 1 月 
份 系数 .现在 2 月 份 系数 表示 1 月 份 平均 气温 与 2 月 份 平均 气温 的 差异 ，3 月 份 系数 表示 3 月 
份 和 1 月 份 平均 气温 的 差异 ， 以 此 类 推 . 同样 ， 这 种 情况 下 , t 值 和 Pr( 二 1t|)(zp 值 ) 是 检验 
没有 多 大 意义 的 假设 注意， 此 时 截 距 系 数 加 上 2 月 份 系数 正好 等 于 图 表 3-3 中 的 2 月 份 
系数 . 
BR 3-4 ” 带 截 距 项 的 季节 均值 模型 回归 结果 


fi 计 标准 误差 t {fi Pr(> |+|) 
1 月 16. 608 0. 987 16. 83 <0. 0001 
2 月 4. 042 1. 396 2. 90 0. 00443 
3 月 15. 867 1. 396 11. 37 <0. 0001 
4 月 29. 917 1. 396 21. 43 <0. 0001 
5 月 41. 483 1. 396 29. 72 <0. 0001 
6A 50. 892 1. 396 36. 46 <9. 0001 
7 月 55. 108 1. 396 39. 48 <0. 0001 
8 月 52. 725 1. 396 37.78 <0, 0001 
9 月 44. 417 1. 396 31. 82 <0. 0001 
10 月 34. 367 1. 396 24, 62 <0. 0001 
11 月 20. 042 1. 396 14. 36 <0. 000] 
12 月 7.033 1. 396 5. 04 <0. 0001 


= 
> model3=lm(tempdub~month.) # January is dropped automatically 


> summary (model3) 
vv 一 


= 执 25 


余弦 趋势 


月 度数 据 的 季节 均值 模型 包含 了 12 个 独立 的 参数 ， 但 完全 没有 考虑 季节 趋势 的 形状 ， 例 
如 ，3 月 份 和 4 月份 的 均值 非常 接近 (但 与 6 月 份 和 7 月 份 不 同 ) 的 事实 并 没有 在 模型 中 反映 
出 来 ， 菜 些 情 况 下 ， 季 节 赵 势 可 以 简洁 地 用 余 终 曲线 来 模型 化 ， 余 区 曲 线 能 在 反映 从 一 个 时 期 
到 男 一 个 时 期 的 平滑 变化 的 同时 仍然 保留 季节 性 . 

考虑 用 下 面 方程 表示 的 余弦 曲线 

tt, = Bcosl2x ft + @) (3.5. 4} 

我 们 称 BC) WHARA, (WHER, DARRA. A t 的 变化 ， 曲 线 在 最 大 值 8 
和 最 小 值 一 ?之 间 皖 动 ， 鉴 于 每 1/ 了 个 时 间 单 位 曲线 严格 重复 自身 ，1/ 了 被 称 作 余弦 波动 的 周期 ， 
正如 在 第 2 章 中 指出 的 一 样 ， 焉 代表 在 时 间 轴 上 的 任意 初始 值 . 对 用 时 间 标 记 1,2,… 的 月 度数 据 ， 
最 重要 的 频率 是 /=1/12, KARERA RRIA 12 个 月 重复 一 次 ， 我 们 称 这 个 周期 为 12. 

方程 3.3.4 不 便于 估计 ， 因 为 参数 8 和 下 在 表达 式 中 不 是 线性 的 ， 从 和 运 的 是 ， 存 在 三 
角 函 数 的 恒等式 ， 可 以 把 方程 3.3.0 重新 参数 化 为 更 便利 的 形式 ， 即 


Boos(2x ft + P) = B,cos(2n ft) + esin 2rft) (3. 3. 5) 
其 中 
B= VP 二 BBE, & = atan(— f/f) (3. 3. 6) 
而 且 ， 求 道 得 到 
Bi = Becos(®), PB = Psin(®) (3.3.7) 


为 了 用 回归 技术 估计 参数 B AP. RIAA cos(2nft) 和 sin(2xft) 作为 回归 变量 或 者 

这 类 趋势 模型 中 最 简单 的 可 以 表示 如 下 ; 

pe = By + ficos(2rft) + Asin nft) (3. 3. 8) 
这 里 的 常数 项 B 可 以 被 认为 是 频率 为 零 的 余弦 ， 

在 任何 实际 例子 中 ， 我 们 必须 注意 是 怎么 度量 时 间 的 ， 因 为 时 间 度 量 的 选择 会 影响 我 们 关 
心 的 频率 值 ， 比 如 ， 如 果 我 们 有 月 度数 据 以 1,2,3,… 为 时 间 尺 度 ， 那 么 1/12 就 是 我 们 最 关心 
的 频率 ， 相 应 的 周期 是 12 个 月 ， 但 是 ， 如 果 我 们 以 年 和 年 的 比率 来 度量 时 间 ， 比 如 ，1980 表 
示 1A, 1980. 083 33 表示 1980 年 的 2 月， 以 此 类 推 ， 那么 频率 1 对 应 着 一 年 或 12 个 月 的 
周期 ， 

图 表 3-5 是 一 个 在 基础 频率 上 对 月 平均 气温 序列 拟 合 的 余弦 曲线 的 例子 . 


图 表 3-5 气温 序列 的 余弦 趋势 模型 


系 数 fA H 标准 误差 t {Ë Pr(> |e]? 
截 距 46. 2660 0. 3088 149. 82 <0. 0001 
cosl fnt) — 26. 7079 0. 4367 一 在 1. 15 <0. G001 
sin (2xt) — 2, 1697 0. 4367 —4.97 <0. 0001 


> har.=harmonic (tempdub,1) 
> model4=-lm(tempdub~har. } 


> summary (model4) 
0 
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在 这 个 输出 结果 中 ， 时 间 是 以 年 度量 的 ， 以 1964 年 为 最 初 值 ，! 年 为 频率 . 时 间 序 列 值 
与 拟 合 的 余弦 曲线 一 起 展示 在 图 表 3-6 中 .趋势 对 数据 拟 合 得 相当 好 ， 除 了 多 数 1 月 份 的 值 ， 
这 里 1 月 份 的 观测 值 低 于 模型 的 预测 值 . 


图 表 3-6 气温 序列 的 余弦 趋势 


1964 1966 1968 1970 1972 1974 1976 
年 份 


> win.graph(width=4.875, height=2.5,pointsize=8) 

> plot (ts (fitted (model4) ,freq=12,start=c(1964,1)), 
ylab='Temperature',type='1', 

> ylim=range (c(fitted(model4) ,tempdub))); points (tempdub) 

> # ylim ensures that the y axis range fits the raw data and the 
Fitted values 


另外 的 具有 其 他 频率 的 余弦 函数 经 常 被 用 于 建立 周期 性 趋势 模型 . 对 于 月 度 序 列 ， 较 高 的 
谐 波 频率 (如 2/12 和 3/12)》 会 更 适合 并 且 有 时 会 增加 模型 的 拟 合 度 ， 但 是 要 以 在 模型 中 增加 
更 多 参数 为 代价 .实际 上 ， 可 以 证 明 任 何 具 有 周期 为 12 的 周期 性 趋势 都 可 以 严格 地 表示 为 6 
对 余弦 -正弦 函数 之 和 .这 些 概念 会 在 傅 里 时分 析 或 谱 分 析 中 详细 论述 ， 我 们 将 在 第 13 章 和 第 
14 章 进 一 步 讨论 这 些 概念 . 


3.4 回归 估计 的 可 靠 性 和 有 效 性 

我 们 假设 序列 可 以 表示 为 Y, 二 jp 十 X,， 其 中 jp 是 之 前 讨论 的 确定 趋势 ，{X,) EFF 
稳 过 程 ， 自 协 方差 函数 和 自 相关 函数 分 别 是 n Ao. 不管 我 们 拟 合 的 是 线性 时 间 超 和 努 、 季 站 
性 趋势 、 余 弦 趋 势 还 是 其 他 趋势 ， 普 通 回归 都 是 根据 最 小 二 乘法 的 原则 在 线性 模型 中 估计 
参数 ， 

我 们 首先 来 考虑 最 简单 的 情况 一 一 季节 性 均值 . 如 前 所 述 ， 季 节 性 均值 的 最 小 二 乘 佑 计 仪 
仅 是 季节 平均 数 ， 因此， 如 果 有 (完整 的 ) N 年 的 月 度数 据 ， 则 对 第 j 个 季度 均值 的 估计， 我 
们 可 以 表示 为 

A= NZ Yini 
AAA 是 像 了 一样 的 平均 数 ， 但 是 只 用 了 每 隔 12 期 的 观测 值 ， 我 们 可 以 很 容易 地 修正 方 
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fi (3.2.3) 得 到 Var). 用 NCE) RË n, H pz 代替 ps 得 到 


Var(3,) = rized (1-4 jara |， 太一 12 
我 们 注意 到 ， 如 果 (X0 BARA, W Var(B) 简化 为 yp/N， 正 如 预期 的 那样 。 进一步， 如 
RAIL o 不 为 零 但 p14 一 0， 那么 我 们 也 仍然 有 Varl(B=n/N. 不 管件 人 么 情况 ， 只 有 季节 
自 相 关系 数 0129 p24 3 036 » … 出 现在 方程 (3. 4.1) H, 因为 N 几乎 不 会 太 大 (可 能 除了 季度 
数据 )， 像 方程 (3. 2. 5) 那样 的 近似 通常 没什么 用 处 ， 
现在 我 们 讨论 方程 〈3. 3. 8) 中 表示 的 余弦 趋势 . 对 于 任何 形 如 f=m/n ORR, Hm 
是 满足 l<m<in/2 的 整数 ， 余 弦 和 正 芯 的 振幅 房 AB, 的 估计 存在 明确 的 表达 式 ， 


a = ZD [eos( “mY, ], f = ZD [sin “mm VY, | (3.4.2) 
(这些 实际 上 是 时 间 序 列 CY.) SRR mn HARKER DMKA SR. ) 
因为 这 些 是 关于 (Y) 的 线性 函数 ， 所 以 可 以 用 方程 (2. 2. 6) 计算 它们 的 方差 .我 们 得 到 


Varl) = 77445) Sos 222) o cos ( EE )o- | (3. 4. 3) 


其 中 我 们 用 到 > Lcos(2nmt/n) |’ =n/2 这 个 事实 ， 但 是 ， 方 程 (3. 4. 3) 中 两 次 求 和 一 般 不 


能 进 一 如 果 用 正弦 代替 余弦 ， 则 可 以 得 到 关于 Var) 的 一 个 类 似 的 表达 式 . 
WR (X) EARE, RAE 2ya/n. MR AO, p =O ROL, MA m/n= 
1/12, A 


Var(B) = Akar 十 122 S\cos( 2) cos( 2442) | (3. 4. 4) 
TALS tr BA AR ZAHA., 我 们 计算 了 多 个 有 代表 性 的 值 
n Var(B) 


25 ea 


50 en 


m 


rl 


) 
500 ad 73p1) 
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Co (之 (1+2pcos(€ )) = (=) +1, 7320) (3. 4. 5) 
如 果 pi 二 一 0. 4， 那 么 大 样本 下 方程 (3.4.5) PARAE 1+1.732(—0.4)=0. 307， 相 对 于 
白 噪声 的 情况 ， 方 差 降低 了 大 约 70%. 

在 某 些 情况 下 ， 季 节 性 均值 和 余弦 趋势 可 以 被 认为 是 对 周期 性 趋势 建 模 的 莹 争 对 于 . 假如 
简洁 的 余弦 模型 是 适当 的 ， 那 么 使 用 不 太 简 洁 的 季节 均值 模型 损失 有 多 严 重 呢 ? 要 解决 这 个 问 
题 ， 我 们 必须 首先 考 虚 如 何 比 较 模 型 .参数 本 身 不 能 直接 比较 ,但 是 我 们 可 以 在 可 比较 的 时 所 
上 比较 趋势 的 估计 . 


28. 第 3 新 


考虑 LAGS AMEE. Hao. 利用 季节 均值 ， 该 估计 量 仅 仅 是 1 月 份 的 平均 数 ， 
方差 由 方程 (3. 4. 1) 给 出 .利用 余弦 趋势 模型 ， 相 应 的 估计 量 是 


a A a 2m a . /2 
2 om( 3) + 
为 了 计算 这 个 入 计量 的 方差 ， 我 们 需要 更 多 的 条 件 ， 该 模型 中 名 ， 馈 MA 是 无 关 的 8， 这 是 源 


于 所 售 余 政和 正 蓄 的 正 交 关系 .可 查阅 Bloomfield(1976) 或 者 Fuller(]996) 来 了 解 更 名 的 组 
节 . AE. HETRE, RHA 
27 


Var(fi) = Var( 房 ) + Varcĝ | cos ( 75) | F Var(&)[ sin( 33) | (3. 4. 6) 


在 首次 比较 时 ， 假 设 随机 项 是 白 品 声 ， 那 么 在 季节 性 均值 模型 中 估计 量 的 方差 就 是 yo/ N. 
在 余弦 模型 中 ， 我 们 用 方程 (3. 4. 6) ATH 3.4.0 以 及 相应 的 正 强 等 式 ， 得 到 
Var) = ža [1+ 2] cos(-t) | +2[ sin(Z)] | 一 3 n 

这 是 因为 〈cosb)2 + Csin)’ =1. Alk, ARN EEE S E D ER E o E 2 HY e EE 
3yo/n n 3N 
Yo/ N = J3 

特别 地 ， 对 月 度 气 温 序 列 ， 我 们 有 n=144 和 N=12， 因 此 ， 比 率 等 于 
3(12) 


一 一 一 = 0.5 


144 
由 此 可 见 ， 在 余弦 模型 中 ，1 月 效应 估计 量 的 标准 差 只 是 用 季节 均值 模型 估计 的 一 半 一 一 这 是 
一 个 实质 的 收获 . 〈 当 然 ， 其 前 提 假 设 为 余弦 趋势 加 白 噪 声 模型 是 正确 的 模型 . ) 
现在 假设 随机 项 使 得 m 天 0 但 wm =OCR> 1). 对 季节 均值 模型 ，1 月 份 效应 估计 量 的 方差 不 
会 改变 (见方 程 〈3.4.1))， 对 余弦 趋势 模型 ， 如 果 样 本 容量 足够 大 ， 则 可 以 使 用 方程 
(3.4.5)， 即 关于 Var(ĝ) 的 相同 的 表达 式 和 关于 Varho 的 方程 (3.2.3) 来 获得 


Var(ġ) = mate + 2m + 2[1 + 2p:cos( 75) |} = 2 (3 +2e:| 1+ 2cos( 5) || 


如 果 op =—0.4, ABA 0.8147. /n, FAA HO P WREE S F AT Oe PF E 2 A 


比率 是 
2 am a [=E 


如 果 令 n=144, N=12, WAELE 
0.814012) _ 
‘eau = 0. 26 
的 确 是 大 幅度 地 下 降 ! 


现在 我 们 转向 线性 时 间 趋 势 ， 对 这 类 趋势 来 说 ， 关 于 记 的 方程 (3. 3. 2) 的 男 一 个 公式 更 
简便 ， 可 以 证 明 ， 和 斜率 的 最 小 二 乘 估 计量 可 以 写成 


© ”这 假定 了 1/12 是 一 个 “ 傅 里 叶 频 率 "， 即 它 是 n/n 的 形式 ， 理 则 ， 这 些 情 计量 仅仅 是 近似 不 相关 的 . 


SS 二 
人 (3. 4.7) 
>a! 
因为 佑 计量 是 了 值 的 线性 组 合 ， 在 估计 它 eee A 我 们 有 
F 127 
Var(ĝ) = 3 fs pl 3+ at = A) U-Di- Dp) (3. 4. 8) 


其 中 ， 我 们 使 用 了 > GP? =n(n®—1)/12. URE. BAUR IRR AE AE. 


为 了 说 明 方 程 (3. 4. 8) 的 效用 ， 再 一 次 考虑 m 天 0 但 py =—0CR> 1) WHIT. Ae, ict 
一 些 代 数 变 换 ， 和 包括 连续 整数 及 其 平方 求 和 ， 方 程 (3. 4. 8) BM 


127 3 
Var(A) = tt [1 + eà) E. 
.对 充分 大 的 n， 我 们 可 以 忽略 3/n 项 ， 有 
Var(B) = ZU + 2a) (3. 4. 9) 


nln? — 1) 

mo =—0.4, BA1+2o,=0.2, Ak, Â 的 方差 只 是 当 {X,) 是 白 噪声 时 的 20%. 4K, 
如 果 上 二 0， 方 差 会 大 于 和 白 噪 声 时 的 情况 ， 

现在 我 们 比较 最 小 二 乘 估 计量 与 所 谓 的 最 佳 线性 无 偏 估 计量 (BLUE) 或 广义 最 小 二 
(GLS) 估计 量 . 如 果 随 机 项 (X) 不 是 白 噪声 ， 可 以 来 构造 趋势 函数 中 的 未 知 参数 的 估计 量 ; 
它们 是 数据 的 线性 函数 ， 是 无 偏 的 而 且 在 所 有 估计 量 中 方差 最 小 一 一 所 谓 的 BLUE 或 者 GLS 
佑 计量 这些 估 计量 及 其 方差 可 以 用 某 些 矩 阵 及 其 道 矩 阵 来 清晰 地 表示 . (在 Draper 和 Smith 
(1981) 中 可 以 找到 详细 介绍 . ) 但 是 ， 构 造 这 些 估 计量 需要 完全 了 解 随 机 项 的 协 方差 图 数 ， 事 
实 上 ， 在 所 有 的 实际 应 用 中 该 函数 是 未 知 的 ， 可 以 基于 对 趋势 的 初 估计 ， 递 归 佑 计 {X,} 的 协 
方差 函数 .用 估计 的 (Xo 的 协 方差 男 数 重 新 估计 趋势 ， 因 此 ， 选 代 得 到 赵 努 的 病 近 BLUE. 
该 方法 在 第 11 章 再 进一步 探讨 . 

幸运 的 是 ， 一 些 基 于 大 样本 的 结论 支持 我 们 使 用 简单 的 最 小 二 乘 来 估计 我 们 考虑 的 趋势 . 
特别 是 ， 我 们 有 以 下 结论 (更 多 细节 见 Fuller(1996), 476—480 H): 假设 趋势 是 时 间 的 多 项 
式 ， 是 三 角 函 数 多 项 式 ， 季 节 均 值 ， 或 者 是 它们 的 线性 组 合 ， 那 么 ， 对 于 一 般 的 平稳 随机 项 
{(X,) ， 在 大 样本 下 ， 趋 势 的 最 小 二 乘 估 计量 < 与 最 佳 线性 无 偏 估计 量 有 相同 的 方差 . 

尽管 简单 最 小 二 乘 估 计量 可 以 渐 近 有 效 ， 但 是 不 能 保证 作为 所 有 回归 惯例 报告 出 来 的 系数 
标准 差 的 估计 是 正确 的 ， 我 们 将 在 下 一 节 分 析 这 一 问题 ， 我 们 还 要 提醒 读者 ， 以 上 结果 仅 限 于 
某 些 类 型 的 趋势 ， 一 般 地 ， 不 能 推广 到 对 任意 预测 变量 进行 的 回归 ， 比 如 其 他 的 时 间 序 列 . 外 
如 ，Fuller(1996，518 一 522 页 ) 讲 到 如 果 Y, 二 82, 十 X,， 其 中 (X0) 有 简单 随机 结构 而 {2 
也 是 平稳 序列 ， 那 么 8 的 最 小 二 乘 估计 量 即 使 在 大 样本 下 也 可 能 是 非常 无 效 和 有 偏 的 . 


3.5 回归 结果 的 解释 
我 们 曾经 提 到 标准 的 回归 惯例 计算 未 知 回归 系数 的 最 小 二 乘 估计 量 一 一 8 在 随机 项 iX.) 
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满足 最 小 限度 的 假设 下 ， 该 估计 量 是 合适 的 然而， 回归 结果 的 某 些 性 质 极其 依赖 通常 的 
(Xo 是 白 噪声 的 回归 假定 ， 有 些 还 依赖 于 进一步 的 假定 ， 即 X) 是 近似 正 态 分布 ， 我 们 从 
对 假设 依赖 最 小 的 项 目 开 始 . 

考虑 图 表 3-7 展示 的 回归 结果 .无论 假设 的 关于 jy 的 参数 形式 如 何 ， 我 们 用 /, 表示 趋势 
的 佑 计量 ， 比 如 ， 对 线性 时 间 趋 势 ， 有 = BAe 对 每 一 个 卢 无 法 观测 的 随机 项 X, 可 用 
Y. ~~ Kit CMD. MAME (X,; 有 常数 方差 ， 那么 可 以 用 残 差 的 标准 差 


pa ear (3.5.1) 


来 估计 X, 的 标准 善 ， 即 wy . RP p EREA a 中 参数 的 个 数 ，n 一 pp 称 为 s 的 自由 度 ， 
s 的 值 给 出 了 对 趋势 估计 拟 合 优 度 的 绝对 度量 s HERD., WARRT. 然而，s 的 值 〈 如 
60. 74) 在 解释 上 有 些 困 难 . 

趋势 氢 合 优 度 的 无 单位 度量 是 R 值 ， 也 称 为 可 决 系数 或 者 多 重 尺 方 ，R” 可 以 解释 为 它 是 
观测 序列 与 估计 的 趋势 之 间 的 样本 相关 系数 的 平方 ，R” 也 表示 序列 的 变化 被 估计 的 趋势 所 解 
FERD. 图表 3-7 是 对 随机 游 动 数 据 拟 合 一 条 直线 得 到 的 比较 完整 的 回归 结果 ， 扩 展 了 我 们 
在 图 表 3-1 中 见 到 的 内 容 . 


图 表 3-7 对 随机 游 动 线性 拟 合 的 回归 结果 


fi 计 标准 误差 Zii Pr(> jeD 
WE — 1. 007 888 0. 297 245 3. 39 0. 001 26 
时 间 0. 134 087 0. 008 475 15. 82 <0. 0001 
残 差 的 标准 误差 1. 137 具有 58 个 自由 度 
QO RA 0.812 
调整 后 的 民 方 0. 809 
F Sit 250. 3 具有 1 和 58 的 自由 度 ;  {fi<0. 0001 


> modell=lm(rwalk~time (rwalk)) 
> summary (modell) 


根据 图 表 3-7， 随 机 游 动 序列 中 大 约 SI“MM BLU ARENA BARE. 调整 后 的 
R? 对 R? 做 了 很 小 的 调整 ， 获 得 了 基于 趋势 中 待 估 参数 个 数 的 近似 无 偏 估 计量 ， 利 用 不 同 的 
参数 数量 比较 模型 是 有 用 的 ， 在 任何 关于 回归 的 书 中 都 可 以 找到 计算 R 的 各 种 公式 ， 例 如 
Draper 和 Smith(1981). 输出 结果 中 用 标准 误差 表示 的 系数 的 标准 差 在 解释 时 需要 小 心 ， 只 
有 在 随机 项 是 白 噪 声 (常规 的 回归 假设 ) 时 解释 才 是 恰当 的 . 例如 ， 图 表 3-7 中 的 值 1. 137 
是 根据 方程 (3. 4. 8〉 计 算 的 数值 的 平方 根 ， 其 中 二 0 时， 有 pi 一 0， 并 且 用 5 估计 X%， 大 


约 是 
— J120. 137 
0. 008 479 = N 600807 — D 
重要 的 一 点 是 这 些 标准 差 基 于 随机 项 是 白 噪声 的 假设 , 但 对 时 间 序 列 而 言 事 实 很 少 如 此 . 
图 表 3-7 中 的 上 值 或 者 上 比率 是 回归 系数 的 估计 除 以 各 自 的 标准 误差 。 如 果 随 机 项 是 正春 
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分 布 的 白 品 声 ， 那 么 这 些 比 率 为 检验 回归 系数 的 显著 性 提供 了 合理 的 检验 统计 量 ， 在 每 种 情况 
下 ， 零 假设 是 对 应 的 未 知 系数 等 于 零 . 显著 水 平和 p 值 通过 mn 一 pp 个 自由 度 的 t 分 布 来 确定 ， 
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正如 我 们 提 到 过 的 ， 无 法 观测 的 随机 项 {X,) 可 以 通过 残 差 来 估计 或 预测 : 
Å, =Y,-—2 (3. 6.1) 

预测 确实 是 一 个 更 合适 的 术语 .我 们 用 术语 估计 来 表示 对 未 知 参数 的 猜测 ， 用 术语 预测 表示 对 
无 法 观测 的 随机 变量 的 估计 ， 我 们 称 义 , 为 对 应 第 上 个 观测 的 残 差 . 如 果 趋 势 模型 比较 恰当 ， 那 
么 残 差 应 该 基本 上 像 真实 随机 项 那样 变化 ， 对 随机 项 不 同 的 假设 可 以 通过 观察 残 差 来 评估 .如 
果 随 机 项 是 白 噪 声 ， 那 么 残 差 在 行为 上 应 该 大 致 类 似 于 均值 为 零 、 标 准 差 为 s 的 独立 〈 正 态 ) 
随机 变量 .因为 对 任何 趋势 的 最 小 二 乘 拟 合 都 包含 常数 项 ， 因 此 自动 产生 一 个 零 均 值 的 残 差 ， 
我 们 可 以 考虑 使 用 议 ,/s 将 残 差 标准 化 . 但 是 ， 大 多 数 的 统计 软件 都 考虑 了 所 拟 合 的 回归 模型 
的 特性 ， 因 而 会 在 分 母 上 使 用 更 为 复杂 的 标准 误差 来 对 残 差 进行 标准 化 . 

利用 得 到 的 残 差 或 标准 残 差 ， 下 一 步 是 研究 残 差 的 各 种 图 形 ， 首 先 观 察 残 差 的 时 间 序 列 
图 ， 如 果 数 据 可 能 具有 季节 性 ， 我 们 会 像 图 表 1-9 那样 使 用 符号 标记 ， 这 样 易于 识别 同一 季节 
的 残 差 . 

首先 ， 我 们 用 以 季节 均值 模型 拟 合 的 月 平均 气温 序列 来 说 明 残 差分 析 的 一 些 概念 图表 
1-7 显示 了 该 数据 的 时 间 序 列 图 ， 图 表 3-8 显示 了 用 季节 均值 模型 拟 合 的 月 平均 气温 序列 的 标 
准 残 差 的 时 间 序 列 图 .如 果 随 机 项 是 白 噪 声 ， 模 型 充分 地 拟 合 了 趋势 ， 我 们 预期 该 图 形 应 该 呈 
现 一 个 矩形 散 点 图 而 没有 任何 明显 的 模式 .该 图 表 没 有 出 现 明 显 的 偏离 随机 性 外 观 的 情况 ， 图 
表 3-9 重复 了 该 时 间 序 列 图 ， 但 是 增加 了 季节 符号 标志 ， 同 样 没 有 明显 的 与 一 年 中 不 同月 份 有 
关 的 模式 . 

图 表 3-8 气温 季节 均值 的 残 差 一 时 间 图 


0 20 40 60 80 100 120 140 
时 间 


> plot (y=rstudent (model3) ,x=as.vector (time (tempdub) ), 
xlab='Time', ylab='Standardized Residuals',type='o') 
一 


az B3% 


图 表 3-9 ” 带 季节 性 图 标的 残 差 一 时 间 图 


时 间 


> plot (y=rstudent (model3) ,x=as.vector (time (tempdub) ),xlab='Time', 

> ylab='Standardized Residuals',type='1') 

> points (y=rstudent (model3) ,x=as.vector (time (tempdub) ), 
pch=as.vector (season (tempdub) ) ) 


接 下 来 ， 我 们 观察 标准 残 差 与 估计 的 相应 趋势 ， 或 者 拟 合 值 ， 如 图 表 3-10 所 示 . 再 一 次 
地 ， 我 们 的 目的 是 寻找 模式 ， 是 不 是 较 小 的 残 差 伴随 着 较 小 的 拟 合 趋势 值 ， 较 大 的 残 差 伴随 着 
较 大 的 拟 合 趋势 值 ?是 不 是 变动 较 小 的 残 差 伴随 着 某 种 规模 的 拟 合 趋势 值 而 变动 较 大 的 残 差 伴 
随 着 其 他 类 型 的 拟 合 趋势 值 ? 3 月 份 的 残 差 变动 有 些 大 ，11 月 份 的 残 差 变动 较 小 ,但 是 图 表 
3-10 并 没有 引 人 注 目的 模式 使 得 我 们 对 季节 均值 模型 产生 怀疑 ， 


AR 3-10 ”气温 季节 均值 模型 标准 残 差 与 拟 合 值 
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40 
拟 合 的 趋势 值 


> plot (y=rstudent (model3) ,x=as.vector (fitted (model3)), 
xlab=-'Fitted Trend Values', 

> ylab='Standardized Residuals',type='n') 

> points (y=rstudent (model3) ,x=as.vector (fitted (model3)), 


pch=as. vector (season (tempdub) ) ) 
ee Re Eee ke se = = 
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整体 非 正 态 性 可 以 由 残 差 或 标准 残 盖 的 直方 图 来 评估 图表 3-11 显示 了 气温 序列 季节 均 
值 模型 的 标准 残 差 的 频率 直方 图 ， 图 形 像 正 态 分 布 那样 ， 呈 现 某 种 对 称 性 并 且 在 高 值 和 低 值 两 
端 逐 渐 减 小 ， 


图 表 3-11 季节 均值 模型 标准 残 差 直方 图 


频率 


标准 残 差 


> hist (rstudent (mode13) ,xlab='Standardized Residuals') 


正 态 性 可 以 通过 所 谓 的 正 态 得 分 或 者 分 位 数 一 分 位 数 (QQ) 图 来 仔细 地 检验 ， 这 样 的 图 
显示 了 数据 的 分 位 数 和 根据 正 态 分 布 计算 的 理论 分 位 数 ， 对 于 正 态 分 布 数据 ，QQ 图 看 起 来 近 
似 于 一 条 直线 ， 图 表 3-12 显示 了 气温 序列 季节 均值 模型 标准 残 差 的 正 态 得 分 QQ 图 ， 此 处 的 
直线 型 图 形 支持 了 该 模型 中 随机 项 是 正 态 分 布 的 假设 . 


图 表 3-12 OOH: 季节 均值 模型 的 标准 残 差 


样本 分 位 数 


> win.graph (width=2.5,height=2.5,pointsize=8) 
> qqnorm(rstudent (model3) ) 


一 个 有 名 的 正 态 性 检验 是 Shapiro-Wilk 检验 8. 该 检验 的 本 质 是 计算 残 差 与 其 相应 的 正 态 分 
位 数 之 间 的 相关 系数 ， 相 关 性 越 小 ， 就 越 有 理由 否定 正 态 性 ， 把 这 种 方法 应 用 于 这 些 残 差 可 以 得 


© Royston, P. (1982) “An Extension of Shapiro and Wilk’s W Test for Normality to Large Samples.” Applied Sta- 
tistics, 31, 115—124. 


到 检验 统计 量 WW 二 0. 9929， 力 值 为 0.6954， 我 们 不 能 拒绝 模型 的 随机 项 是 正 态 分 布 的 零 假 设 . 

有 几 种 方法 可 以 检验 随机 项 的 独立 性 ， 游 程 检验 依次 检验 残 差 寻找 模式 一 一 能 够 否定 独立 性 的 
模式 ， 高 于 或 者 低 于 中 位 数 的 游程 被 计数 ,游程 比较 少 意味 着 邻近 的 残 差 正 相 关 ， 并 倾向 于 随 着 时 
间 “ 一 起 变动 "” 男 一 方面 ， 游 程 太 多 意味 着 残 差 围绕 中 位 数 振荡 。 相 邻 残 差 负 相关 ， 因 此 ， 游 程 过 
少 或 过 多 ， 都 导致 我 们 拒绝 独立 性 ， 对 这 些 残 差 进 行 游程 检验 S 得 到 以 下 的 值 ， 观 测 到 的 游程 三 65， 
预期 的 游程 二 72. 875， 从 而 p 值 等 于 0. 216， 我们 不 能 拒绝 这 个 季节 均值 模型 的 随机 项 是 独立 的 . 
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检验 依赖 性 的 另 一 个 非常 重要 的 诊断 工具 是 样本 自 相 关联 数 . 考虑 任意 数据 序列 YY，Y;，… 
Y, 的 顺序 一 一 不 管 是 残 差 、 标 准 残 差 、 原 始 数据 ， 或 者 是 数据 的 某 些 变换 ， 暂 且 假 设 序列 平 稳 ， 可 
以 对 若干 不 同 的 滞后 上 1，2，… 估 计 自 相关 函数 mw， 最 显而易见 的 方法 是 计算 间隔 & 个 时 间 单 位 
的 配对 ， Bj (Yis Yiteds (Yo Yota)» (Yz s Yata)» vere (Yn kt Yad 之 间 的 样本 相关 系数 . 然而 ， 
考虑 到 假定 平稳 性 ， 这 意味 着 序列 有 不 变 的 均值 和 方差 ， 我 们 稍微 地 修正 一 下 该 方法 ， 因此， 我 们 
定义 样本 自 相 关 函 数 no CHARA, i 

D Y-Y Ya 一 了 
n 一 5n o ae, kl, 2 (3.6. 2) 
0 
注意 ， 在 所 有 地 方 我 们 使 用 了 “总 平均 ”Y， 并 且 除 以 “总 平方 和 ”， 而 不 是 像 在 普通 相关 系数 中 用 到 
的 两 个 单独 标准 差 的 乘积 ， 我 们 还 注意 到 分 母 是 n 个 平方 项 的 和 ， 而 分 子 只 包含 了 nn 一 个 交叉 乘积 . 
出 于 一 系列 原因 ， 该 式 成 为 样本 自 相关 函数 的 标准 定义 ，r 相对 灌 后 的 图 形 经 常 被 称 为 相关 图 . 

这 里 令 人 感 兴 趣 的 是 在 随机 项 中 发 现 了 可 能 的 关联 性 ， 因 此 标准 残 差 的 样本 自 相 关 函 数 有 
很 大 意义 ， 图 表 3-13 显示 了 气温 序列 季节 均值 模型 标准 残 差 的 样本 自 相关 函数 .所 有 值 都 在 
水 平 虚线 内 ， 它 们 位 于 零 加 减 2 倍 样 本 自 相 关系 数 的 近似 标准 误差 ， 即 士 2/Yn. r 的 值 就 是 


图 表 3-13 季节 均值 模型 残 差 的 样本 自 相 关系 数 
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WU ee 
> win.graph (width=4.875,height=3,pointsize=8) 
> acf (rstudent (model3) ) 


O R4t: runs(rstudent(model3)). 
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o 的 估计 值 . 就 这 点 而 论 ， 它 们 有 上 自身 的 样本 分 布 、 标 准 误差 和 其 他 性 质 、 目 前 ， 我 们 把 六 当做 
描述 性 的 工具 ， 这 些 主 题 的 讨论 将 在 第 6 章 和 第 8 章 中 给 出 根据 图 表 3-13， 对 k= 1,2,*…,21 ， 
没有 一 个 假设 p= 二 0 在 常用 的 显著 性 水 平 上 被 拒绝 ， 因 此 ， 推 断 该 序列 的 随机 项 为 白 品 声 是 合 
理 的 . 

作为 第 二 个 例子 ， 考 虑 用 直线 拟 合 随 机 游 动 序列 的 标准 残 差 . 图表 3-2 显示 了 数据 和 拟 合 
线 . 标准 残 差 的 时 间 序 列 图 见 图 表 3-14. 


图 表 3-14 用 直线 拟 合 随机 游 动 得 到 的 残 差 


标准 残 差 


30 
时 间 


> plot (y=rstudent (modell) ,x=as.vector (time (rwalk)), 
ylab='Standardized Residuals',xlab='Time',type='o') 


在 这 个 图 中 ， 相 对 白 噪 声 来 说 ， 残 差 “ 一 起 变动 ”得 太 多 一 一 图 形 太 平滑 ， 进一步， 看 上 
去 序列 的 后 1/3 与 前 2/3 相 比 波动 更 大 ， 图表 3-15 显示 了 类 似 的 效果 ， 较 大 的 残 差 伴随 着 较 
大 的 拟 合 值 . 


图 表 3-15 ” 残 差 与 来 自 拟 合 直线 的 拟 合 值 


标准 残 差 


2 4 
拟 合 趋势 线 的 值 


> win.graph(width=4.875, height=3,pointsize=8) 
> plot (y=rstudent (modell) ,x=fitted (modell), 
ylab='Standardized Residuals',xlab='Fitted Trend Line Values', 


type='p') 
0 

标准 残 差 的 样本 自 相 关 函 数 〈 见 图 表 3-16) 证 实 了 图 表 3-14 中 我 们 观察 到 的 时 间 序 列 图 
的 平滑 性 .1 阶 滞后 和 2 阶 滞后 自 相关 系数 大 于 正 的 2 倍 标 准 误差 ，5 EEA 6 阶 滞后 自 相 
关系 数 小 于 负 的 2 倍 标准 误差 . 这 不 是 我 们 对 白 噪 声 过 程 的 期 望 
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图 表 3-16 来自 直线 模型 残 差 的 样本 自 相 关 
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> act (rstudent (model1)) 


最 后 ， 我 们 回 到 图 表 1-1 中 显示 的 洛杉矶 年 降雨 量 . 在 该 序列 中 ， 我们 没有 发 现 序 列 依赖 
性 的 证 据 ， 但 是 现在 寻找 否定 正 态 性 的 证 据 ， 图 表 3-17 显示 了 该 序列 的 正 态 分 位 数 -分 位 数 
图 、 我 们 发 现 图 形 有 明显 的 弯曲 .一 条 穿 过 第 一 和 第 三 正 态 分 位 数 的 直线 帮助 指明 图 形 对 直线 
的 偏离 . 

EX 3-17 洛杉矶 降雨 量 序列 分 位 数 一 分 位 数 图 


样本 分 位 数 


理论 分 位 数 


> win.graph(width=2.5,height=2.5,pointsize=8) 
> qqnorm(larain); qqline(larain) 


3.7 小 结 


本 章 的 主要 内 容 是 描述 、 建 模 和 估计 时 间 序 列 的 确定 性 趋势 ， 最 简单 的 确定 性 “趋势 ”是 
常数 均值 函数 ， 估 计 常 数 均值 的 方法 已 经 给 出 ， 但 更 重要 的 是 研究 了 在 不 同 条 件 下 对 佑 计量 准 
确 度 的 评估 ， 然 后 ， 使 用 回归 方法 来 估计 时 间 上 的 线性 或 二 次 的 趋势 . 接 下 来 是 关于 周期 性 或 
季节 性 趋势 建 模 的 方法 ， 还 研究 了 所 有 这 些 回归 方法 的 可 靠 性 和 有 效 性 ， 最 后 一 六 开局 本 用 于 
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研究 拟 合 模 型 品质 的 残 差 分 析 工 作 ， 并 引入 了 非常 重要 、 人 贯穿 本 书 其 他 部 分 反复 涉及 的 样本 日 
相关 函数 ， 


习题 
3.1 当 考 虑 模型 YY, 一 久 十 Bi 十 改 , 时 ， 证 明 B 和 BB 的 最 小 二 乘 估 计量 满足 方程 (3. 3. 2). 
3.2 假设 Y; =ute, El 求 Var(Y), 注意 任何 与 众 不 同 的 结果 . 特别 地 ， 把 你 的 管 案 与 Y, = ut 


。 时 的 结果 进行 比较 (提示 ; 首先 对 ae) 做 些 代数 简化 ， 可 以 避免 方程 G2 3).) 


3.3 (BY. =ute +e. R Vary). HRHSRS Y, Sute 时 的 结果 进行 比较 ， 分 析 
{Y,} 的 自 相 关 性 对 Var(Y) 的 影响 . 
3.4 数据 文件 hours 包含 了 1982 年 7 月 到 1987 年 6 月 美国 制造 业 部 门 每 周 的 平均 工作 时 
间 值 . 
(a》 画 出 并 解释 这 些 数据 的 时 间 序 列 图 . 
(b) 用 不 同 的 绘图 标志 代表 不 同 的 月 份 构造 时 间 序列 图 ， 此 时 你 的 解释 与 Ca) 的 有 所 不 
同 吗 ? 
3.5 数据 文件 wages 包含 了 1981 年 7 月 到 1987 年 6 月 美国 服装 和 纺织 品行 业 工人 的 平均 时 
薪 〈 以 美元 计 ) 的 月 度 值 . 
Ca) 画 出 并 解释 这 些 数据 的 时 间 序 列 图 . 
(b) 对 该 时 间 序 列 用 最 小 二 乘法 拟 合 线性 时 间 趋 势 ， 解释 回 归结 果 . 保存 拟 合 模型 的 标 
准 残 差 以 便 进 一 步 分 析 ， 
(c) 构造 并 解释 来 自 〈b) 的 标准 残 差 的 时 间 序 列 图 . 
(d) 对 工资 时 间 序 列 用 最 小 二 和 药 法 估计 二 次 时 间 趋 势 . 解释 回归 结果 .保存 标准 残 差 以 
便 进一步 分 析 ， 
Ce) 绘 出 并 解释 (D 中 标准 残 差 的 时 间 序 列 图 ， 
3.6 数据 文件 beersales 包含 了 1975 年 1 月 到 1990 年 12 月 美国 月 度 啤酒 销售 量 (单位 : HA 
H). 
Ca) 画 出 并 解释 这 些 数据 的 时 间 序 列 图 . 
(b 用 不 同 的 绘图 标志 代表 不 同 的 月 份 构造 时 间 序 列 图 .你 的 解释 与 《a) 的 有 所 不 
jj? 
(c) AnA EAE REMS RTA. EAR. RE ERE A E 
一 步 分 析 . 
(d) 构造 并 解释 来 自 《〈c) 的 标准 残 差 的 时 间 序 列 图 ， 确 保 用 正确 的 绘图 标志 来 检验 标准 
(e) 对 酒 销售 量 时 间 序 列 数据 用 最 小 二 乘法 拟 合 一 个 季节 均值 十 二 次 时 间 趋 势 ， 解释 回 
归结 果 ， 保 存 标准 残 差 以 便 进一步 分 析 . 
(fy 构造 并 解释 来 自 〈e) 的 标准 残 差 的 时 间 序 列 图 .再 一 次 用 正确 的 绘图 标志 来 检验 残 
差 中 残留 的 任何 季节 性 . 
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3.7 


3.8 


3.9 


3. 10 


3. 12 


RIF 


数据 文件 winnebago 包含 了 1966 年 11 月 到 1972 年 2 月 的 Winnebago AMA AMARA 

的 单位 销量 . 

Ca) 画 出 并 解释 这 些 数 据 的 时 间 序 列 图 . 

(b) 对 这 些 数据 用 最 小 二 乘法 拟 合 直线 . 解释 回归 结果 . 画 出 来 自 拟 合 的 标准 残 差 的 时 
间 序 列 图 ， 给 出 解释 . 

(c) 现在 对 月 度 售 价 数据 取 自 然 对 数 . 画 出 并 解释 变换 后 数据 的 时 间 序 列 图 . 

(d) 对 对 数 数 据 用 最 小 二 乘法 拟 合 直线 . 画 出 并 解释 该 拟 合 的 标准 残 差 的 时 间 序 列 图 . 

Ce) 现在 对 对 数 售 价 时 间 序 列 用 最 小 二 乘法 拟 合 季节 均值 十 线性 时 间 趋 势 . 保存 标准 残 
差 以 便 进一步 分 析 ， 检 验 该 模型 各 回归 系数 的 统计 显著 性 . 

Cf) mH (e) 中 标准 残 差 的 时 间 序 列 图 .给 出 解释 

数据 文件 retail 列 出 了 1986 年 1 月 到 2007 年 3 月 U.K. (大 不 列 颠 联合 王国 ) 零售 总 额 

(单位 : 10 LER). 数据 没有 经 过 “季节 调整 *， 基 期 2000 年 三 100. 

(a) 画 出 并 解释 这 些 数据 的 时 间 序 列 图 . 务必 使 用 便于 发 现 季 节 性 的 绘图 标志 . 

(b) 对 该 时 间 序 列 运用 最 小 二 乘法 拟 合 季节 均值 十 线性 时 间 趋 势 . 解释 回归 结果 并 保存 
该 拟 合 的 标准 残 差 以 便 进一步 分 析 . 

(c) 创建 并 解释 (b) 中 的 标准 残 差 的 时 间 序 列 图 .务必 使 用 恰当 的 绘图 标志 来 核对 季 
节 性 . 

数据 文件 prescrip 给 出 了 1986 年 8 月 到 1992 年 3 月 U.S. 月 度 医药 处 方 成 本 . 这 些 数据 

来 源 于 新 泽 西 州 医药 项 目 ， 是 每 个 处 方 的 成 本 . 

(a) 画 出 并 解释 这 些 数 据 的 时 间 序 列 图 .使 用 便于 发 现 季 节 性 的 绘图 标志 . 

(b) 计算 处 方 成 本 月 对 月 变化 的 百分率 并 画图 .同样 使 用 便于 发 现 季 节 性 的 绘图 标志 . 

Cc) 对 百分率 变化 序列 使 用 最 小 二 乘法 拟 合 基础 频率 为 1/12 的 余弦 趋势 ， 解 释 回 归结 
R. 保存 标准 残 差 . 

d) 为 了 研究 余弦 趋 势 模型 的 恰当 性 ， 画 出 标准 残 差 的 时 间 序 列 图 ， 并 解释 该 图 形 . 

(继续 习题 3. 4) 再 一 次 考虑 hours 中 的 时 间 序 列 . 

(a) 对 这 些 数据 用 最 小 二 乘法 氢 合 二 次 趋势 ， 解释 回 归结 果 并 保存 标准 残 差 以 便 进 一 步 
分 析 . 

(b) 画 出 标准 残 差 的 时 间 序 列 图 并 解释 ， 运 用 月 度 绘图 标志 ， 以 便 容 易 地 识别 可 能 的 季 
节 性 . 

(c) 对 标准 残 差 进行 游程 检验 ， 分 析 结 果 ， 

(d) 计算 并 解释 标准 残 差 的 样本 自 相关 函数 . 

(e) 研究 标准 残 差 (误差 项 ) 的 正 态 性 . 考虑 直方 图 和 正 态 图 .解释 图 形 . 

(继续 习题 3. 5) 回 到 wages 序列 . 

(a) 考虑 用 最 小 二 乘法 拟 合 二 次 时 间 趋 势 得 到 的 残 差 . 

(b) 对 标准 残 差 进行 游程 检验 ， 并 解释 结果 . 

(c) 计算 并 解释 标准 残 差 的 样本 自 相关 . 

(d) 研究 标准 残 差 (误差 项 ) 的 正 态 性 .考虑 直方 图 和 正 态 图 ， 解 释 图 形 . 

(继续 习题 3. 6) 考虑 数据 文件 beersales 中 的 时 间 序 列 . 
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(a) 获得 用 最 小 二 乘法 拟 合 李 贡 均值 十 二 次 时 间 赵 劳模 型 得 到 的 残 差 . 
Cb) 对 标准 残 差 进行 游程 检验 ， 并 解释 结果 ， 

Co) 计算 并 解释 标准 残 差 的 样本 自 相 关 . 

Cd) 研究 标准 残 差 (误差 项 ) 的 正 态 性 . 考虑 直方 图 和 正 态 图 . mans 


《继续 习题 3. 7) 回 到 winnebago 时 间 序 列 . 


Ca) 对 对 数 单位 售 价 计 算 用 最 小 二 乘 拟 合 季节 均值 十 线性 时 间 趋 势 模型 的 残 差 . 

(b) 对 标准 残 差 进行 游程 检验 ， 并 解释 结果 ， 

(c) 计算 并 解释 标准 残 差 的 样本 自 相 关 . 

(d) 研究 标准 残 差 (误差 项 ) 的 正 态 性 .考虑 直方 图 和 正 态 图 ,解释 图 形 ， 

(继续 习题 3. 8) 数据 文件 retail 包含 了 U.K. 月 度 零 售 数据 ， 

(a) 获得 用 最 小 二 乘 拟 合 季节 均值 十 线性 时 间 趋 势 模 型 的 残 差 . 

(b) 对 标准 残 差 进行 游程 检验 ， 并 解释 结果 . 

(ec) 计算 并 解释 标准 残 差 的 样本 自 相 关 . 

(d) 研究 标准 残 差 (误差 项 ) HEAK. 考虑 直方 图 和 正 态 图 .解释 图 形 . 

(继续 习题 3. 9) 再 一 次 考虑 prescrip 时 间 序 列 . 

(a) 对 百分率 变化 序列 使 用 最 小 二 乘法 拟 合 基础 频率 为 1/12 的 余弦 趋势 ， 保 存 标准 
BR FE 

(b) 对 标准 残 差 进行 游程 检验 ， 并 解释 结果 . 

(c) 计算 并 解释 标准 残 差 的 样本 自 相 关 ， 

(d) 研究 标准 残 差 (误差 项 ) 的 正 态 性 ， 考 虑 直方 图 和 正 态 图 .解释 图 形 . 

假设 {Y,) 是 平稳 时 间 序 列 ， 其 自 相 关 函 数 形 如 pi 一 具 ，&>0， 其 中 % 是 〈 一 1，1) 内 


的 常数 . 
Yrlt$ 2$01—$) 
(a) 证 明 : Var(Y) =") Ig Gap | 


(提示 : 运用 方程 3. 2. 3)， 有 限 几何 求 和 D) =F 与 相关 求 和 $) o= 


i > # jo 
(Cb) 如 果 n 很 大 ， 证明 Vara | 


Cc) MH (1 十 办 /0 一 惫 WA, pF (-1, D 之 间 ， 借 助 于 估计 过 程 均值 的 精确 度 
来 解释 这 个 图 . 
证 明 方 程 (3.2.6). (提示 : 需要 用 到 以 下 事实 : 


es 


STH ] 
一 — l. 
k=O 1 - $ ERS ) 


证 明 方 程 〈3. 2.7). Gee: 需要 用 到 以 下 两 个 和 式 : 
= 1) = n(n+1)(2n+1) 
die = Ae Sie = 到 a 3 


i=] f=] 


第 4 章 平稳 时 间 序 列 模型 


本 章 讨论 一 大 类 参数 时 间 序 列 模型 一 一 自 回归 滑动 平均 模型 CARMA) 一 一 的 一 些 基本 
概念 ， 这 类 模型 在 真实 过 程 建 模 中 具有 重要 作用 . 


4.1 一 般 线 性 过 程 


我 们 始终 令 (Y) 表示 观测 到 的 时 间 序 列 ， 而 且 此 后 我 们 令 (e) 代表 未 观测 到 的 白 噪声 
序列 ， 即 一 列 均 值 为 零 的 独立 同 分 布 的 随机 变量 . 很 多 情况 下 ， 独 立 性 假设 可 用 {e,) 为 不 相 
关 的 随机 变量 这 一 更 弱 的 假设 代替 ， 但 这 种 假设 条 件 上 很 微弱 的 改善 不 值得 追求 . 

一 般 线 性 过 程 (Y) 可 以 表示 成 现在 和 过 去 白 品 声 变量 的 加 权 线 性 组 合 : 

Y,=€@ 二 he es 4,061) 
如 果 表 达 式 的 右边 事实 上 是 一 个 无 穷 级 数 ， 那 么 需要 给 权 数 y 加 上 一 定 的 条 件 ， 这 样 右 边 的 表 
达 式 才 在 数学 上 有 意义 ， 为 此 ， 只 需 假 设 


DY <x (4, 1.2) 
i=] 


还 应 该 注意 到 ， 因 为 (e) 是 无 法 观测 到 的 ， 所 以 假设 e 的 系数 为 1 不 会 导致 方程 (4.1.2) 
HA ATE, BI po =1. 
文中 经 常会 提 到 的 一 个 非 平 凡 重要 的 例子 为 yb 是 指数 递减 的 形式 : 
p =P 
Kp pRFID 
Y, = e, + ¢e,,; HP en 十 … 
对 这 个 例子 来 说 ， 
ECY,) = Ee, + ¢e,.,; HP en ++) 一 0 
因此 ，{Y,} 有 常数 零 均值 ， 同 时 ， 
Var(Y,) = Var(e, + $e, HP em 十 *…) 
= Var(e,) + # Var(e_,) +$¢' Var(e,..) +” 


=@(1+¢ + + n) = SE LATA R 
进一步 地 ， 
Cov(Y, ,Y_1) = Cov(e, 十 ge rı HP erg + ser Her HP e He) 
—_ Cov(ge，， sem) + Cov(¢’ e,-» $e) -一 eae 
= fori t+Pa tha 十 … = poil +H +4 + 
= E ( 再 次 对 几何 级 数 求 和 ) 
因此 ， 


Corr(Y,,Y,1) = ee / [el =a 


平移 时 间 序 列 模型 4] 


ee _ fo: 
同 理 可 得 Cov(Y,, ee aL 因此 


Corr(Y, Y) =F (4. 1. 3) 

值得 重点 关注 的 是 ， 如 此 定义 的 过 程 是 平稳 过 程 一 一 目 协 方差 结构 只 与 时 间 间 隔 有 关 ， 与 

绝对 的 时 间 无 关 ， 对 于 一 般 线 性 过 程 ， Y, Se, The- Tre- Ts 类 似 上 述 计 算 ， 可 得 下 面 
的 结果 ， 


El =n tie 2S0 (4.1.4) 
=O 


其 中 央 =1， 把 六 加 到 方程 (4.1.1) 的 右边 可 以 得 到 一 个 非 零 均值 过 程 ， 由 于 均值 不 影响 过 
程 的 协 方差 特性 ， 所 以 可 以 假设 均值 为 零 ， 直 到 我 们 开始 对 数据 拟 合 模型 . 


4.2 滑动 平均 过 程 


当 有 限 个 系数 由 不 为 零 的 时 候 ， 我 们 得 到 所 谓 的 滑动 平均 过 程 . 此 时 ， 和 稍微 改 变 符号 ， 

写成 ; 
Y, = e, — hemi — es ~ * — es (4. 2.1) 

我 们 称 该 方程 为 g 阶 滑动 平均 过 程 ， 简 记 为 MAC). 

用 l],—,— 0 PR JEF €, rei seres" rE ,的 权 数 平均 得 到 Y,» 再 滑动 权 数 至 Eml Er’ 
El 9" sb gti 得 到 baer 以 此 类 推 ， 术语 滑动 平均 由 此 得 来 . 滑动 平均 模型 最 早 由 Slutsky 
(1927) 和 Wold(1938) 进行 研究 . 

一 阶 滑动 平均 过 程 

我 们 首先 研究 简单 却 非常 重要 的 一 阶 滑 动 平 均 过 程 ， 即 MAC) 序列 .我 们 没有 把 方程 
(4.1.4) 用 于 这 个 特例 ， 而 是 重新 推导 那些 结论 ， 这 样 更 有 启发 性 ， 模 型 表达 为 : Y, 5e, — beni. 
因为 只 涉及 一 个 系数 9， 所 以 去 掉 多 余 的 下 标 1， 显 然 ，E(Y,)= 二 0，Var(Y,) 二 of I+). ER} 

Cov(Y ,了 |) = Cov(e, — te, ie li 一 De) = Cov(— hemi sEm) =— Gg? 
和 
Cov(Y Y2) = Cove, — ĝe s€2 — he3) = 0 

因为 Y, 和 YY,_: 的 表达 式 中 没有 相同 下 标的 e (BB. Cov(Y,, Yin) =0, k=2, Mit xT 
1 阶 滞后 时 ， 不 存在 自 相关 ， 当 后 面 需 要 给 实际 数据 选择 合适 模型 的 时 人 息 ， 这 个 性 质 很 


重要 . 
总 之 ， 对 于 MA(1) 模型 YY,==e, 一 be 1: 
ECY,) = 0 
n = Var(Y) =E +E) 
7) =— 00; (4. 2. 2) 
p = (-0)/A+ 6) 


Yi = p =O Ree 


Ə 如 此 变化 的 原因 后 面 会 解释 某 些 统计 软件 ， 例 如 R， 在 8 前 使 用 十 ， 检查 你 的 软件 使 用 何 种 习惯 表达 方 陈 . 


42 R4* 


方程 (4.2.2) 中 8 和 pi 的 一 些 数值 可 以 帮助 说 明 各 种 可 能 性 ， 需 要 注意 的 是 ， 负 的 0 所 
对 应 的 p 可 以 通过 简单 地 取 正 的 9 所 对 应 的 p 的 负数 得 到 . 


g m=—6/ +8) g n=—0/ +8) 
0. 1 —0. 099 | 0. 6 | | —D. 441 
0.2 — 0. 192 . 0.7 —0. 470 
0.3 —0. 275 0. 8 — 0. 488 
0. 4 — ü. 345 0.9 — ü, 497 
0.5 — 0. 400 1.0 — 0. 500 


演算 表明 ， 当 9= 一 1 时 可 得 到 最 大 值 p, 一 1/2， 当 0=1 时 可 得 到 最 小 值 mn 一 一 1/2 (见习 
题 4. 3)， 图表 4-1 显示 了 9E (一 1，1) 时 一 阶 滞后 自 相 关 画 数 图 . 

习题 4. 4 要 求证 明 当 非 零 值 9 由 1 代替 时 ， 仍 图 表 4-1 ARO FMA) 的 一 
可 得 到 相同 的 m， 例 如， 在 6 一 1/7/2 和 6 一 17/(17 2 一 2 阶 灌 后 自 相 关 函 数 
fier, o (A. OR MAC) 过 程 的 a= | 一 
0. 4， 我 们 仍然 无 法 确切 知道 8 的 值 ， 在 4.5 PHI 0.4 
可 逆 性 时 ， 我们 再 讨论 这 个 问题 . 

图 表 4-2 显示 了 模拟 的 MAC) 序列 的 时 间 序 列 
图 ， 该 过 程 4 一 一 0.9， 并 且 具 有 正 态 分 布 的 白 品 声 . a 00- 


回顾 图 表 4-1， 此 模型 下 pı =0. 4972, He AA — Br H Ja -0.2 
存在 中 等 强度 的 正 相 关 ， 在 该 数据 的 时 间 序 列 图 中 这 | 
种 相关 性 非常 明显 ， 因 为 连续 观测 值 趋 于 密切 相关 . ae 
如 果 一 个 观测 值 高 于 该 序列 的 平均 水 平 ， 那 么 下 一 个 PARTE 


观察 值 一 般 也 高 于 平均 值 ， 图 形 随 时 间 的 变化 比较 平 0 
滑 ， 只 是 偶尔 有 较 大 波动 . 


图 表 4-2 6= 一 0.9 时 MA(1) 过 程 的 时 间 序列 图 


> win.graph (width=4.875,height=3,pointsize=8) 
> data(mal.2.s); plot (mal.2.s,ylab=expression(Y[t]),type='0') 


“FE AS wf fa] AP Fi] HE AY 43 


在 图 表 4-3 中 刻画 了 Y, 和 YY,-1 的 关系 ， 一 阶 滞后 自 相关 更 加 明显 . 此 图 显示 了 显 着 的 上 
升 趋势 . 


HR 4-3 图 表 4-2 中 MAL1) 序列 的 Y 与 Y,-1 的 散 点 图 


> Win.graph (width=3,height=3,pointsize=8) 
> plot (y=mal.2.s,x=zlag(mal.2.s),ylab=expression(Y[t]), 
xlab=expression(Y[t-1]),type='p') 


图 表 4-4 中 Y 和 Y, He iB Pd A ed Bh as T AREL a A RO. 


> plot (y=mal.2.s,x=zlag(mal.2.s,2),ylab=expression(Y[t]), 


xlab=expression(Y[t-2]),type='p') 
0 


图 表 4-5 呈现 了 一 个 略微 不 同 的 时 间 序列 图 ， 该 序列 是 模拟 的 6 一 0.9 的 MAC) EFN, 
回顾 图 表 4-1， 此 模型 下 pi 二 一 0. 497， 表 明 一 阶 沾 后 存在 中 等 强度 的 负 相 关 ， 从 时 间 序 列 


和 


平均 水 平 ， 闭 么 下 一 个 观察 值 一 般 低 于 平均 值 ， 图 形 随 着 时 间 的 推 欧 旦 锯齿 状 一 一 特别 是 与 
图 表 4-2 相 比 . 


图 表 4-5 6=0.9 时 MA(1) 过 程 的 时 间 序 列 图 


> win.graph (width=4.875,height=3,pointsize=86) 
> data(mal.1.s) 
> plot (mal.1.s,ylab=expression(Y[t]),type='0') 


负 的 一 阶 滞后 自 相 关 在 图 表 4-6 的 滑 后 图 中 更 加 明显 . 
图 表 4-6 图 表 4-5 中 MA(1) 序列 的 Y, 与 Y,-, 的 散 点 图 


> win.graph (width=3, height=3,pointsize=8) 

> plot (y=mal.1.89,x=2lag {mal.1.s) ,ylab=expression(Y[t]), 
xlab=expression(¥[t-1]),type='p') 

i 


图 表 4-7 P Y, 和 Y, ;的 散 点 图 显示 了 该 模型 二 阶 泣 后 目 相 关 为 0. 
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表 4-7 图 表 4-5 中 MA) 序列 的 Y, 与 Y,-; 的 散 点 图 


-4 过 0 2 


> plot (y=mal.1.s,x=zlag(mal.1.s,2),ylab=expression(Y[t]), 
xlab=expression(Y[t-2]),type='p') 


MACO) 过 程 超过 一 阶 滞后 ， 不 存在 自 相 关 ， 但 是 随 着 阶 数 的 增加 ， 可 以 得 到 高 阶 的 相关 
RR. 


二 阶 滑动 平均 过 程 
现在 来 考虑 二 阶 滑动 平均 过 程 ; 
Y, =e — hers — fhe 


其 中 
y, = Var(Y,) = Varle, — hen — he) = A+G +e 
yi = Cov(Y,sY, 1) = Covle, — heri — her: r€ — he-2 — hem) 
= Cov(— femi sem ) + Cow(— fiere s — Orez) 
= [~-A +0 h] = (-A Hao; 
及 


n= Cov(Y, Y, 2) = Cove, — fen — O€: sEm 一 Dera — fhe) 
= Cov(— hen: sE) =— that 
因此 ， 对 MAC2) 过 程 : 


— A +b 
1+6 +E 


-~-_ 一色 (4. 2. 3) 
 T+é +64 


0 k= 3,45" 


| 


对 于 特例 : Y, See- +0. bez A 
—1+(1)(—0.6) _ —1.6 _ 


06 
m = > 36 = 0. 254 


图 表 4-8 显示 了 MAC) 过 程 模拟 的 时 间 序 列 图 ， 在 单位 时 间 内 ， 序 列 倾 向 于 围绕 均值 来 回 
震 划 ， 这 反映 了 一 阶 沾 后 较 强 的 负 自 相关 . 


图 表 4-8 具有 有 =1，6 = 一 0.6 的 MA(2) 过 程 的 时 间 序 列 图 


> win.graph(width=4.875, height=3,pointsize=8) 
> data(ma2.s); plot (ma2.s,ylab=expression(Y[t]),type='0o') 


图 表 4-9 的 散 点 图 反映 了 极 明显 的 负 自 相关 . 


> win.graph (width=3,height=3,pointsize=8) 

> plot (y=ma2.s,x=zlag(ma2.s) ,ylab=expression(YI[t]), 
xlab=expression(Y([t-1]),type='p') 

0 


图 表 4-10 显示 了 二 阶 清 后 正 的 弱 目 相关 . 
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图 表 4-10 图表 4-8 中 MA(2) 序列 的 Y, 与 Y,-; 的 散 点 图 


> plot (y=ma2.s,x=zlag(ma2.s,2),ylab=expression(Y{[t]), 
xlab=expression(Y[t-2]),type='p') 


最 后 ， 从 图 表 4-11 的 散 点 图 可 以 看 出 三 阶 滞后 显然 不 存在 自 相 关 . 
图 表 4-11 图 表 4-8 中 MA(2) 序列 的 Y, SY. RA 


> plot (y=ma2.s,x=zlag(ma2.s,3),ylab=expression(Y[t]), 
xlab=expression (Y[t-3]),type='p') 


一 般 MA( 9) 过 程 
对 于 一 般 MA(q) We: Y, =e, — Q e1 —he,-2 dn ’ 类 似 计算 得 到 : 
% = UHE +4 +e +h ot (4. 2. 4) 


1+6@+6@4+--+¢ (4. 2.5) 


— e + Oi Oeri F Or Orr 5 Soen R.. 494 k = 1,2, sq 
a -| 
0 k>q 


计算 mw 的 分 子 只 有 一 8,， 自 相关 函数 在 滞后 g 期 后 是 “ 截 尾 ” 的 ， 也 就 是 说 ， 自 相关 系数 为 零 . 
早期 的 滞后 下 ， 其 形状 可 以 是 任意 形式 ， 另 一 种 过 程 一 一 自 回 归 过 程 ， 提 供 了 另外 一 种 自 相关 
模式 . 
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顾名思义 ， 自 回归 过 程 是 用 自身 做 回归 变量 .具体 来 说 ，p 阶 自 回 归 过 程 {Y,) 满足 方程 : 
Y, = $Y i HHY He HPY te, (4. 3. 1) 
EJ Y, 的 当期 值 是 自身 最 近 p 阶 沾 后 项 和 新 息 项 e, 的 线性 组 合 ， 其 中 e 包括 了 序列 在 上 期 无 
法 用 过 去 值 来 解释 的 所 有 新 信息 ， 因 此 ， 对 于 每 一 个 :， 假设 e 独立 于 了 -ivY-:， Y-:… . 
Yule(1926) 对 自 回 归 过 程 进行 了 最 初 的 研究 2 . 
一 阶 自 回归 过 程 
仍然 首先 详细 研究 具有 启发 性 的 一 阶 自 回 归 模 型 ， 简 记 为 ARO). 假设 过 程 平稳 并 且 满 足 : 
Y, = $Y i +e (4. 3. 2) 
为 简便 起 见 ， 把 系数 $ 的 下 标 1 去 除 ， 与 往常 一 样 ， 在 刚 开 始 的 分 析 中 ， 假 设 过 程 的 均值 已 经 
被 去 掉 ， 因 此 序列 的 均值 为 零 . 以 后 将 涉及 平稳 的 条 件 . 
首先 ， 对 方程 (4. 3. 2) 的 两 边 求 方差 ， 得 到 
| % =F Hn to 
求解 Yo» 得 : 
= (4. 3. 3) 


注意 ， 立 刻 得 到 一 个 隐 伟 条件 几 二 1 或 1$| 二 1. RE, HH 4.3.2) 两 边 同 时 乘 以 


Y, (k= 二 1,2,…), 并 求 期 望 值 
i tf) $E CY -aY ) + Ete, Y) 


或 
Ye = 炒 上 :十 下 (ee) 
因为 假设 这 个 过 程 是 零 均值 的 平稳 过 程 ， 并 且 e 独立 于 Y-*， 所 以 有 结论 : 
E(e,Y-.) = Ele )E(Y m) = 9 
因此 


% = Yeis k=1,2,3,. (4, 3. 4) 
S k=l, WA y, = =¢0.°/A-#)s Q k=2, 我 们 得 到 =f P). 由 此 可 得 一 

般 形 式 : 
n = # 一 一 | (4, 3. 5) 


因此 ， 
on = Zt = #, b= 125008" (4, 3. 6) 
Yo 


O BERERE Y, 具有 零 均 值 ， 我 们 总 是 可 以 在 方程 中 用 Y, 一 “代替 Y, 引入 非 零 均值 . 
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因为 1$| 二 1， 随 着 灌 后 长 度 的 增加 ， 自 相关 函数 值 呈 指 数 递 减 .。 关 0 二 =p 一 1， 自 相关 函 
数 为 正 ; 若 一 1 二 $< 一 0， 一 阶 自 相 关系 数 是 负数 (pi 一 归 ， 接 下 来 自 相关 系数 的 符号 正 负 交 蔡 ， 
自 相 关 函 数 的 绝对 值 呈 指数 递减 . 图 表 4-12 呈现 了 几 个 自 相关 函数 图 的 一 部 分 . 


图 表 4-12 几 个 AR(1) 模型 的 自 相关 函数 


P; 


00 04 08 
P: 
0.0 04 08 


1.0 
1.0 


Pi 
-1.0 0.0 
Pi 
-1.0 0.0 


注意 当 $ 在 土 ] 附近 时 ， 指 数 递 减 得 很 慢 ( 例 如 ，(0.9)' 二 0. 53)， 但 对 于 较 小 的 $， 递 减 
速度 相当 快 〈 例 如 ，(0. 4)* 一 0.004 10)， 当 $ 在 土 1 附近 时 ， 强 自 相 关 性 将 会 持续 许多 期 ， 如 


果 % 是 正 数 得 到 相对 平滑 的 序列 ， 如 果 # 是 负数 得 到 锯齿 状 序列 ， 

图 表 4-13 显示 了 在 g% 一 0.9 下 ， 模 拟 的 ARC) 过 程 的 时 间 序 列 图 . 注意 ， 时 间 序 列 穿 过 
理论 均值 零 的 频率 非常 之 低 ， 时 间 序 列 存在 大 量 惯性 一 一 一 起 变化 ， 在 相当 长 时 间 内 曲线 会 停 
留 在 均值 的 一 边 ， 观 测 者 可 能 会 说 该 序列 存在 一 些 趋势 ， 我 们 知道 ， 事 实 上 ， 理 论 均值 在 所 有 
时 间 都 为 零 ， 具 有 趋势 的 错觉 是 因为 序列 的 相 邻 值 存在 很 强 的 自 相 关 . 


图 表 4-13 当中 =0.9 时 AR(1) 序列 的 时 间 序 列 图 


0 10 20 30 40 50 60 
时 间 


> win.graph(width=4.875, height=3,pointsize=8) 
> data(arl.s); plot (arl.s,ylab=expression(Y(t]),type='o') 


a ee 


图 表 4-14 为 模型 的 滞后 图 ， 显 示 了 该 序列 的 平滑 性 和 一 阶 问 后 的 强 自 相关 性 . 
图 表 4-14 图 表 4-13 中 AR{1) 序列 的 Y, 与 Y,-, 的 散 点 图 


> win.graph(width=3, height=3,pointsize=8) 
> plot (y=arl.s,x=zlag(arl.s),ylab=expression(¥[t]), 
xlab=expression(Y¥[t-1]),type='p') 


ARQ) 模型 的 二 阶 滞后 也 具有 强 正 自 相 关 ， 即 o= (0.9) =0.81, AX 4-15 很 好 地 诠释 
了 这 人 一片. 
图 表 4-15 图表 4-13 中 AR(1) 序列 的 Y, 与 Y,-; 的 散 点 图 


> plot (y=arl.s,x=zlag(arl.s,2),ylab=expression(Y[t]), 
xlab=expression(Y[t-2]),type='p') 
I 


最 后 ， 在 滞后 三 期 时 ARO) 仍然 呈现 较 高 的 自 相关 性 : p= (0.9)°=0.729. 对 该 特殊 的 
序列 ， 图 表 4-16 证 实 了 这 一 点 . 
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图 表 4-16 图表 4-13 中 AR(1) 序列 Y, 和 Y,-;3 的 散 点 图 


Y,- 


> plot (y=arl.s,x=zlag (arl.s,3),ylab=expression(Y[t]), 
xlab=expression (Y[t-3]),type='p') 


AR(1) 模型 的 一 般 线性 过 程 表 示 
方程 (4.3.2) 中 给 出 的 ARG) 的 递归 定义 对 于 解释 模型 很 有 用 . 对 于 其 他 目的 ， 把 
ARQ) 模型 表示 为 方程 (4. 1. 1) 中 的 一 般 线性 过 程 有 利于 以 后 的 分 析 . 递归 定义 对 于 所 
有 的 上 都 适用 ， 如 果 我 们 把 方程 〈4. 3. 2) HA t ERA tl, A Yoi =Y Hes FRA 
最 初 的 表达 式 ， 得 到 : 
, = (PY... Heni) +e, =e, + be) HPY 
如 果 我 们 重复 替代 浦 后 项 ， 例如 & 一 1 次 ， 可 得 : 
Y, = e, +e Perr +e Hp emni HO Y (4.3.7) 
假定 1$| 二 1， 令 有 趋 于 无 穷 ， 看 起 来 是 合理 的 (这 几乎 是 严格 的 证 明 )， 我 们 会 得 到 无 穷 
级 数 表达 式 : 
Y, = e, + $em HP enz +P em te (4. 3. 8) 
这 正 是 方程 (4. 1. 1) 一 般 线 性 过 程 的 表达 式 ， 此 时 y=, RIE 4. 1 节 曾 经 讨论 过 . 
注意 ， 该 表达 式 再 次 强调 了 限制 条 件 |19g| <1 的 必要 性 . 
AR(1) 过 程 的 平稳 性 
可 以 证 明 ， 在 条 件 e 独立 于 Yi-1 Y, 29 二: 一 3， +++ Al ae >0 下 ， “4 A124 | ¢| <1 时 ， AR(1) 
的 递归 定义 Y=#Y._1 十 e 的 解 是 平稳 的 .|g| 一 1 的 要 求 ， 通 常 称 为 AR(1) 过 程 的 平稳 条 件 〈 参 
阅 Box, Jenkins 和 Reinsel, 1994, 54 页 ; Nelson, 1973, 39 页 ; Wei, 2005, 32 页 ) ， 即 使 该 条 
件 不 仅仅 涉及 平稳 性 ， 特别 地 ， 参 见习 题 4. 16、4. 18 和 4. 25. 
现在 ， 我 们 需要 注意 的 是 ARG) 过 程 的 自 相 关 函 数 是 用 两 种 方法 推导 得 到 的 .第 一 种 方 
法 用 一 般 线性 过 程 表 示 得 到 方程 (4. 1.3). 第 二 种 方法 使 用 递归 定义 YY 一 %yY-: te 及 其 推导 
结果 方程 (4. 3. 4) (4.3.5) 和 (4.3.6). 第 三 种 推导 是 在 方程 (4. 3. 7) WHARE Y,-: 并 求 
WEA, EAH es e-s e20 el un 独立 于 Y, -的 事实 ， 第 二 种 方法 应 得 到 重视 ， 因 其 可 
以 容易 地 推广 到 高 阶 过 程 . 
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二 阶 自 回归 过 程 
现 考虑 满足 以 下 方程 的 序列 ; 
Y, = AY FAY te, (4. 3. 9) 
与 通常 一 样 ， 假 设 e WAF YYY 为 了 讨论 平稳 性 ， 引 人 AR 特征 多 项 式 ， 
d(x) = 1—¢,2— 4,2’ 
和 相应 的 AR 特征 方程 ， 
l1—¢x2—¢2° = 二 0 
回忆 一 下 ， 二 次 方程 总 是 有 两 个 根 (可 能 有 复数 根 ). 
AR(2) 过 程 的 平稳 性 
可 以 证 明 ， 在 e 独立 于 YY ssYs，""* 的 条 件 下 ， 当 且 仅 当 AR 特征 方程 的 根 的 绝对 值 
( 模 ) 大 于 1 时 ， TH 4.3.9) 存在 平稳 解 . 有 时 我 们 也 称 复 平 面 上 根 在 单位 圆 外 ， 这 个 结论 
可 以 不 加 任何 改变 地 推广 到 > BAAS. 图 表 4-17 AR(2) 过 程 的 平稳 参数 区 域 
在 二 价 自 回归 模型 中 ， 二 次 特征 方程 的 根 易 找 一 一 一 一 
到 ， 为 ; : 
内 二 (4. 3. 10) | : pi +d h, =0 
为 了 满足 平稳 条 件 ， 要 求 根 的 绝对 值 大 于 1. 在 附 
录 日 中 ， 我 们 证 明了 平稳 性 成 立 ， 当 且 仅 当 满 足以 下 
三 个 条 件 : 
由 +? <1, ¢—% <1, lo |1 
(4. 3.11) 
与 ARQ) 模型 一 样 ， 我 们 称 此 为 AR(2) 模型 的 
平稳 条 件 ， 图 表 4-17 显示 了 平稳 区 域 . 
AR(2) 过 程 的 自 相关 函数 
为 了 推导 出 AR(2) 的 自 相 关 函 数 ， 我 们 使 用 方程 (4. 3. 9) 给 出 的 递归 关系 式 定 义 ， 两 


WELLY- JARE. BEFFE. FH, HHE e 独立 于 Y,,， 得 到 ， 
Ye = $Y thers k= 1,2,3, i. 3. 12) 


或 者 ， 两 边 除 以 s 
De = ipm T fror, & = 15253,° (4. 3.13) 
通常 称 方程 (4.3.12) 或 方程 (4.3.13) 为 Yole-Walker 方程 ， 特 别 是 上 = 二 1 和 2 时 得 到 的 
两 个 方程 ， S k=l, 用 po = 1, p-1 Tpi 两 个 条 件 ， 得 到 o =h thos Pre: | 


a = A (4. 3. 14) 


现在 使 用 已 知 的 aM o), k=2 时 用 方程 (4.3.13) UR. 483): 


O ”这 也 意味 着 对 一 阶 自 回归 ，AR 的 特征 方程 为 1 一 $z 二 0， 根 为 1/#$， 当 且 仅 当 |#| 一 1 时 ， 根 的 绝对 值 大 于 1， 
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问 
o = tion + Prom = meas (4.3.15) 


依次 的 o 的 值 ， 可 以 根据 递归 方程 (4.3.13) 容易 地 计算 得 到 . 

虽然 方程 (4.3.13) Ef Ae 给 定时 可 非常 有 效 地 计算 出 目 相 关 值 ， 但 是 为 了 其 他 目的 ， 
希望 有 一 个 更 明确 的 p 的 公式 显 式 解 的 形式 取决 于 特征 方程 1 一 各 zx 一 各 x =0 的 根 . H G 
和 Go 代表 特征 根 的 倒数 〈 见 附录 B 中 证 明 )， 


c ah VBFR o tt VTS, 
1] 2 bj J — 9 


2 


4 G #G: 时， 可 以 证 明 有 : 
(1 — GiGi" — (1 — Gi JG" 


应 = = L e = 0 (4, 3. 16) 
如 果 特 征 根 是 复数 ‘ 即 如 果 册 十 4 而 二 0)， 则 ps 可 表示 为 ， 
k sin( 6k +) 
Pe =— R sinl) 3 k=0 (4. 3. 17) 


HH, RETR, OMS ALK cos(@)=$,/(2 (hh), tan) 二 [(1 一 各 )/(1 十 加)] 中 求 得 . 
为 了 分 析 的 完整 性 ， 我 们 注意 到 当 特 征 根 相等 时 (各 十 46 二 0 DD, A: 


pr = (1+ ithe) (É), k= 01,205 (4. 3. 18) 


这 些 公式 的 推导 详 见 Fuller(1996) 第 2.5 47. 
这 些 公 式 的 详细 内 容 对 我 们 并 不 重要 ， 我 们 只 需要 了 解 目 相关 函数 可 以 有 各 种 形状 ， 无 论 
在 什么 情况 下 ，p WEE N aA k ADEA EI. 在 复数 特征 根 的 情况 下 ，px 显示 为 阻 
尼 正 弦 波 动 曲线 ， 具 有 阻尼 因子 RO GR<1), WHO, AMO. HK 4-18 中 给 出 了 可 能 的 图 
形 ( 书 后 附录 中 讨论 的 R 函数 ARMAacf 可 以 用 来 画图 ). 
图 表 4-18 JL AR(2) 模型 的 自 相关 函数 


出 三 0.5. 四 三 0.25 $,=1.0, ¢,=-0.25 


Py 
0.0 04 O8 

Py 
0.0 04 08 


Pi 

-0.5 0.0 0.5 1.0 
Pi 

-0.5 0.0 0.5 1.0 
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图 表 4-19 显示 了 由 一 1.5, 各 二 一 0.75 下 模拟 的 AR(2) 序列 的 时 间 序列 图 .图表 4-18 中 

ox 的 周期 性 行为 可 以 从 具有 相同 周期 ( 即 360/30=12 个 时 间 单位 )》 序列 的 近似 周期 性 变化 清 
趟 地 反映 出 来 ， 若 日 的 单位 是 弧度 ，2r/9 有 时 被 称 为 AR(2) 过 程 的 准 周期 
图 表 4-19 ,=1.5， 和 = 一 0.75 下 AR(2) 序列 的 时 间 序列 图 


0 20 40 60 80 100 120 
时 间 


> Win.graph (width=4.875,height=3,pointsize=8) 
> data(ar2.s); plot (ar2.s,ylab=expression(Y[t]),type='o') 


AR(2) 模型 的 方差 
过 程 的 方差 y TUR A, & Mot 表示 如 下 :， 对 方程 (4. 3. 9) 两 边 求 方差 ， 得 到 
Yo = (FH +42) % 十 2 有 和 1 十 (4. 3. 19) 
& k=1, F (4.3.12) 给 出 了 第 二 个 关于 为 An 的 线性 方程 yi =f y tys 结合 方 
Fe (4.3.19) 得 到 


$i = $ ae 1 一 加 Ue 4 
— — ff EE) aE L . 3. 20) 
CGS Le Ie) oa ee ( 


AR(2) 模型 的 w 系数 

AR(2) 模型 的 一 般 线 性 过 程 表达 式 中 的 山系 数 比 ARCO) HAA. 然而， 我 们 可 以 用 方 
程 (4. 1.1)〉 写 出 Y,，Y,_1，Y, ;的 一 般 线性 过 程 表 达 式 ， 代 入 YY, 二 各 了 -1 十 各 了 ,-: 十 e:。 WMR 
我 们 令 e 的 系数 相同 ， 得 到 递归 公式 ， 


bo = 1 
pı — Pid = 0 (4. 3. 21) 
Dp; — Pi pj — Prp = 0 j=2;3,°" 

通过 递归 公式 ， 得 到 =l, h=h, wWH=sth, DIRE. MFR EH A Me, wat 
这 些 关 系 式 可 以 得 到 山系 数 的 数值 解 . 
还 可 以 证 明 ， 在 C AG, 时 ， 显 式 解 为 : 
_ Git! — Gt 
VT G-6  . . 
与 前 文 一 样 ，G 和 Gs 是 AR 特征 方程 的 根 的 倒数 .假如 是 复数 根 ， 方 程 (4.3.22) 可 以 
写作 ， 


(4. 3. 22) 
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_ pj sinl Gt De] 
þh; =R EO (4. 3. 23) 
BAKE AEE EREDAR, RASHE 43.17) 相同 的 阻尼 因子 R 和 频 
率 日 . 
为 了 结论 的 完整 性 ， 我 们 注意 到 当 特征 根 相 同时 ， 有 : 


py = A+ 74 (4, 3. 24) 
一 般 自 回归 过 程 
考虑 p 阶 自 回归 模型 : 
Y, = 出 Yi HAY, + ee +Y + @, (4. 3. 25) 
具有 AR 特征 多 项 式 : 
d(x) = 1— hir frt — e — hpr” (4. 3. 26) 
和 相应 的 AR 特征 方程 : 
1l — fiz — $r’ — ++ — $7? = 0 (4. 3. 27) 


如 前 所 述 ， 假设 e 独立 于 了 1， 了 -和 3 “HR AR 特征 方程 每 一 个 根 的 绝对 值 
( 模 ) 都 大 于 1， 方程 4.3.27) 存在 平稳 解 . 多 项 式 根 和 系数 之 间 的 其 他 关系 可 以 用 来 证 明 
以 下 两 个 不 等 式 是 满足 平稳 性 的 必要 条 件 . 也 就 是 说 ， 为 了 保证 特征 方程 根 的 模 大 于 1， 以 下 
两 个 不 等 式 是 必要 条 件 但 不 是 充分 条 件 : 
内 +f, +--+, <1 
le [<1 
假定 序列 平稳 并 且 均 值 为 零 ， 在 方程 (4.3.25) WARA Y ARMAR ARA yY BT 

以 获得 以 下 重要 的 递归 关系 : 
pe = fipa F Poe FApo to +Pppep> 下 之] (4. 3. 29) 
WE k=1, 2, ~A p RADE (4.3.29), 根据 一 1，p 4 二 pp， 得 到 一 般 Yole-Walker 方 

程 组 : 


(4. 3. 28) 


0 一 $i F $2 01 下 $3 oz 1 $0 pi 
pm = tipi +b: + $20, ++ + Po tA. 3. 30) 
Pp = Pipp-1 + fror + Pappa to +4, 

PATE Pis Potto É, 的 值 ， 可 以 求解 该 线性 方程 组 得 到 Pils 2 9 Pp 的 值 , 从 而 ， 方程 
(4, 3. 29) 可 以 用 来 求 得 任意 高 阶 时 的 py. 

注意 : 

Ee, Y.) = Ele. (hY m HAY Sli + $Y- + e) | = Ee?) = g? 
我 们 在 方程 (4. 3. 25) WAR Y, 并 求 期 望 ， 得 到 ， 
Yo = $ Yı + $a Ya 十 … + $7; +o; 
使 用 pi = Ya Yo ， 该 式 可 以 写 为 ， 


g 
Yo = 一 一 一 一 一 一 4. 3. 31 
Yo 1 $i o Py ps Paps ( ) 
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把 方差 Yo 表示 成 参数 gf $s potro $, 和 已 知 ci， pz »***» Dp 的 形式 . 当然， 在 这 种 一 般 
表示 下 ，ps 的 显 式 解 无 法 得 到 ， 但 是 我 们 可 以 确定 ps 是 一 些 指 数 递减 项 〈 与 特征 方程 的 实 根 
相对 应 ) 和 阻尼 正弦 波动 项 (与 特征 方程 的 复 根 相 对 应 ) 的 线性 组 合 . 

假设 过 程 是 平稳 的 ， 过 程 也 可 用 方程 (4. 1. 1) 的 一 般 线 性 过 程 形式 表示 ,但 p 系数 是 参 
Hd, deo $MM ARM. ART BOR, AAS WRC. 


44 目 回 归 滑 动 平 均 混 合 模型 


如 果 假 定 序列 中 部 分 是 自 回归 ， 部 分 是 滑动 平均 ， 我 们 可 以 得 到 一 个 相当 普遍 的 时 间 序 列 
Re. 一般 来 说 ， 如 果 
Y, = hY TY 二 $Y +e — Gers — theese 一 一 六 Ce- (4. 4. 1) 
RY.) 为 自 回归 滑动 平均 混合 过 程 ， 阶 数 分 别 为 如 和 9， 简 记 为 ARMA(z，9)， 按 惯例 ， 我 
们 首先 看 一 个 重要 的 特例 . 
ARMA{1，1) 模型 
模型 定义 方程 是 : 
_ Y, = $Y +e, — benı : (4. 4. 2) 
为 了 得 到 Yule-Walker 形式 的 方程 组 ， 首 先 : 
E(e,Y,) = Ele, ($Y te, —de-J=0& 
El(er 1Y,) = ELe, ($Y +e, —Oe-1)) = $o? — bo? = ($— Oe: 
WRF (4.4.2) 两 边 乘 以 Y,-, 并 求 期 望 值 ， 得 到 : 


Yo 一 办 ,十 [1 — 0(¢—4) |e? 
Yı = Yo — Oa: (4. 4. 3) 
Ye = PY e k >2 
求解 前 两 个 方程 得 到 : 
Y = 人 (4. 4. 4) 
通过 解 简单 递归 关系 式 ， 得 到 ， 
= UAE Oy, RI (4, 4.5) 


m 1— 264+ 6 
请 注意 ， 随 着 清 后 长 度 & 的 增加 ， 模 型 的 自 相 关 晒 数 指数 递 减 . 阻尼 因子 是 %， 但 递减 开 
始 于 初始 值 ce CERRO. XS ARO) 的 自 相关 函数 不 同 ，AR(1) 的 自 相 关 函 数 虽 然 以 
阻尼 因子 $ 递 减 ， 但 总 是 从 初始 值 mw 三 1 开始 . PM, MAR 4=—0.8, O=0.4, M p =0. 523, 
p =0. 418, o 二 0. 335, 等 等 . Ok 可 能 有 几 种 形状 ， 具体 依赖 于 p 和 上 的 符号 . 
用 类 似 得 到 方程 〈4. 3. 8， 的 方法 ， 可 以 得 到 模型 的 一 般 线性 过 程 表 达 式 : 


日 ”在 混合 模型 中 ， 我 们 假设 在 自 回 归 和 清 动 平均 多 项 式 中 没有 共同 的 因素 . 如果 有 ， 可 以 消除 它们 ， 这 样 模型 将 变 成 
-个 较 低 阶 的 ARMA 模型 ， 如 对 于 ARMA (1, 1) A, RRR 0At. 
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Y,=e+($—-0) P'en (4. 4. 6) 
j=l 


即 
p 一 (9 一 信 贞 1， 了 人 1 

我 们 现在 要 提 到 显然 的 平稳 条 件 | 旨 一 1， 或 等 价 的 AR 特征 方程 1 一 &r=0 的 根 的 绝对 值 
大 于 1 

对 于 一 般 ARMA(p，g) 模型 ， 我 们 不 加 证 明 地 给 出 以 下 结论 : 在 条 件 e 独立 于 站 ， 
Ys Yy F; MEHA AR HIETE O(a) =0 的 根 的 模 大 于 1, WR 4.4.1) 存在 平 
稳 解 . 

车 平稳 性 的 条 件 满 足 ， 模 型 也 可 表示 为 一 般 线 性 过 程 ， 其 中 由 系数 由 下 式 决 定 ， 


go = 1 
by 一 一 由 +4, 


ga = 0a + P: -+ A dy (4, 4. 7) 


由 =— 0; + $y; s feit oe $i pj- 
其 中 ， 当 j 二 0 时 , p50; jog ht, 050. 
再 次 假设 平稳 ， 易 证 自 相 关 函 数 满足 : 
o = Piper Hro to +Pppips RO | (4. 4. 8) 
当 上 二 1，2，3 ,…，g 时 ， 亦 可 获得 含有 A, Ao 0, 的 类 似 公式 ， ME CETHA A 
相关 函数 的 数值 算法 . (在 名 为 ARMAacf 的 及 函数 中 执行 该 算法 . ) 


4.5 可 逆 性 


在 MA(1) 过 程 中 我 们 看 到 当 0 被 1/6 代替 时 ， 得 到 完全 一 样 的 目 相 关 盯 数 ， 在 习题 中 ， 
我 们 求解 一 个 类 似 的 MA(2) 模型 不 唯一 的 问题 ， 给 定 MA 的 自 相关 函数 ， 在 我 们 试图 根据 观 
测 的 时 间 序 列 推导 参数 值 之 前 ， 必 须 解 决 MA 模型 不 唯一 的 问题 ， 证 明显 示 ， 不 唯一 性 与 接 
下 来 讨论 的 看 似 无 关 的 问题 有 联系 ， 

自 回归 过 程 总 是 可 以 通过 山系 数 表 示 为 一 般 线 性 过 程 ， 所 以 AR 过 程 也 可 以 被 认为 是 一 个 
无 穷 阶 滑动 平均 过 程 . 但是， 由 于 某 些 原因 ， 自 回归 表达 式 更 便利 . 那么， 滑动 平均 模型 可 以 
被 重新 表示 为 自 回 归 模 型 吗 ? 

为 了 解决 这 个 问题 ， 考 虑 MA(1) 模型 : 

Y, = e, — ĝe, (4.5.1) 
首先 把 方程 改写 成 e, 二 Y, 十 9e, 1 ， 然 后 用 :一 1 代替 上 并 且 替 代 上 面 公 式 中 的 e,-:， GH: 
e = Y, +0Y 1 +6e2) = Y, HOY thers 
如 果 |19| 二 1， 我 们 可 以 对 过 去 值 无 限 重复 以 上 的 替代 过 程 ， 得 到 表达 式 (与 方程 4.3.7 和 
方程 (4.3.8) 相 比 较 )， 
e = Y, +09 HPY te 
或 者 


Y, = (— OY. 一 站 Y，， 一 单 了 ;一 …) +e, (4.5.2) 
如 果 |0| <1, RHES MAC) AAT Dee RM PC BR. 当 且 仅 当 19| <1, 
我 们 称 MACD) 模型 可 首 . 
对 于 一 般 的 MA(g) 模型 或 ARMA(), gq) 模型 ， 定义 MA 特征 多 项 式 为 : 


Ox) = 1— br — hr? — hr? — — Ox" (4.5.3) 
和 相应 的 MA 特征 方程 ， 
1 — ħax — fr” — 6,27 — e — 9,27 = 0 (4. 5. 4) 
可 以 证 明 MAC) RAO A. IRM ri 使 得 : 
Ye = maY TnaY, F may "Te c4. 5.5) 


当 且 仅 当 MA 特征 方程 根 的 模 大 于 1( 与 AR 模型 的 平稳 性 作对 比 ). 
还 可 证 明 在 给 定 自 相 关 函 数 的 情况 下 ， 只 有 唯一 的 一 组 参数 可 以 得 到 可 逆 的 MA 过 程 . 


lin: Y, 二 e, 十 2e, 1 和 Y, 一 十 e ,有 相同 的 自 相关 函数 ， 但 是 只 有 第 二 个 以 一 2 为 根 的 是 可 


MH. 以后， 我 们 把 注意 力 集中 于 完全 合乎 情理 的 可 逆 模 型 . 
对 于 一 般 的 ARMA(p，g) 模型 ， 要 求 同 时 满足 平稳 性 和 可 逆 性 . 


4.6 小 结 


本 章 介绍 了 简单 而 实用 的 自 回 归 、 滑 动 平 均 CARMA) 时 间 序 列 模型 ， 推 导 了 这 些 模 型 
的 基本 统计 特性 ， 特 别 对 重要 的 特例 〈 一 阶 和 二 阶 滑动 平均 以 及 一 阶 和 二 阶 自 回归 模型 ) 的 统 
计 特 性 进行 了 推导 ， 此 外 ， 还 讨论 了 这 些 特例 的 平稳 性 和 可 逆 性 问题 ,分 析 了 ARMA 混合 模 
型 的 特性 .读者 应 该 熟练 掌握 这 些 模型 的 自 相关 特性 和 模型 的 各 种 表达 式 . 


习题 
4.1 平稳 过 程 定义 如 下 : 
Y, = 5Ha — en then 


用 第 一 个 原理 求 出 其 自 相 关 函 数 . 
4.2 画 出 以 下 MA(2) REMARK, AWA: 
(a) h =0. 5, @=0.4 
(b f= 2s =—0.7 
(c) 上 一 一 1， 凡 三 一 0 .6 
4.3 X MAGC) H., WEH: 
_max pı = 0. 5, _min 1 一 一 0. 5 
4.4 iH ot 1/o 代替 时 ，MA(1) 过 程 的 自 相 关 函 数 不 变 . 
4.5 计算 并 画 出 以 下 几 种 ARC) 模型 的 自 相关 函数 .要 画 出 足够 多 的 沾 后 期 数 以 保证 自 相 
KAREAR. 
(a) %4 =0.6 
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.10 


„11 


. 12 


。 13 


.14 


Eh $ =—0. 6 


(c) $, =0.95 (m 20 个 滞后 期 ) 

(d) $ =0. 3 

假设 (Y) Æ ARQ) H, —-1<¢<1. 

(a) W,=VY.=Y,—-Y.-1, RPI $ Mot RAH A HRR. 

(b) 特别 地 ， 证 明 Var(W,) =20¢/(1+¢4). 

描述 下 列 模型 自 相 关 函 数 的 重要 特性 : 

(a) MA(1) (b) MA(2) (e) AR(1) (d) AR(2) (e) ARMA(1，1) 


令 {Y,} 为 AR(2) 模型 ， 具有 特殊 形式 : Y,=#: Y.-2 te. 用 第 一 原理 求 得 使 过 程 平 稳 


的 加 的 范围 . 


用 方程 (4. 3. 13) 的 递归 公式 计算 并 画 出 具有 下 列 特 定 参 数 的 AR(2) RBH BE R 
数 . 说 明 每 一 种 情况 下 特征 根 是 实数 还 是 复数 . 如 果 是 复数 ， 对 相应 的 自 相 关 晴 数 ， 其 


表达 式 形 如 方程 (4.3.17) 时 ， 求 出 阻尼 因子 R 和 频率 @. 

(a) $, =0. 6, $=0.3 

(b) $, =—0.4, $,7=0.5 

(c) $,=1.2, $% =—0.7 

(d) $} =—1, $ =—0. 6 

(e) $ =0.5, ¢=—0.9 

(f) $ =—0.5, $% =—0. 6 

画 出 下 列 每 个 ARMA 模型 的 自 相关 函数 : 

(a) ARMAC, 1), $=0.7, 0=0.4 

(b) ARMAC, 1),.$=0.7, 0=—0.4 

对 ARMA(C1, 2) 模型 Y, 二 0. 8Y, te, +0. 7e,-, +0. 6e,-25 WEA: 
(a) 4 k>2 时 ， p =O. 8 pr- 

(b) p2=0. 8p; +0. 60: /Yo 

考虑 两 个 MA(2) 过 程 ， 一 个 过 程 的 参数 为 名 一 名 王 1/6， 另 一 个 过 程 的 参数 为 和 一 一 1， 
6, =6: l 
(a) TEAS AY A HK RA. 
(b) 相应 特征 多 项 式 的 根 有 何 区 别 ? 


A (Y) HERTE, 4e>l 时 ps =0. WH: 必须 满足 |p |<1/2, Ger. 考虑 
WarCY。 TY. TY): 然后 考虑 Var(Y .rn 一 了 十 了 e 利用 事实 : 两 者 
必须 对 所 有 ?都 是 非 负 的 . ) 

假设 {Y,} 是 -一 个 零 均值 的 平稳 过 程 ， 当 &>1 时 ，ps=0，lpo |<0.5. WH (Y,} 一 
定 可 以 表示 为 MA(1) 过 程 ， 即 证 明 存 在 白 噪 声 序列 (e) ERE Y, =e — 0e KP p 
满足 条 件 ，&A>>0 时 ，e 与 了 无关. (提示 : ARWEL =A) 的 0; 


然后 令 。 = VOY. WRB (Y) 是 一 个 正 态 过 程 ， 则 “ 亦 是 ， 零 相关 等 价 于 
独立 . ) 
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-15 


.16 


. 17 


.18 


.19 


. 20 


.21 


.22 


.23 


. 24 


hat 


求 两 边 的 方差 . ) 
考 虚 “ 非 平稳 ”AR(1) MWY, =3Y,-1 +e. 


(a) 证 明 Y, =— 25 (1/3)e4; WA ARC) 方程 ， 


(b) 证 明 (a) 中 定义 的 过 程 是 平稳 的 . 
Cc) 该 解 在 什么 方面 不 令 人 满意 ? 


考虑 满足 方程 Y, 一 亏 Y, +e 的 ARO) HE. 


(a) 证明 Y=10 (去 ) tet $e 十 ( 言 ) a-: 十 … 是 ARQ) 方程 的 解 . 

(b) (a) 给 出 的 解 是 否 平 稳 ? 

考虑 某 过 程 满足 零 均 值 , “平稳 ”AR(1) 方程 Y ,二 $8Y,_ 十 ee， 一 1 一 % 一 十 1. Sc AE 

REFR., EMW, SY, Het. 

(a) 证 明 E(W,) =cH. 

(b) 证明 {W,) 满足 “平稳 ”AR(1) FW, =8W,, te. 

Cc) (W, 是 否 平稳 ? 

考虑 MA(6) MA, O,=0.5, 6 =—0.25, fQ =0.125, & =—0.0625, 0 =0. 031 25, 

0; =—0. 015 625， 求 几乎 具有 相同 由 权重 的 简化 模型 . 

考虑 MA(7) 模型 ， 久 二 1， 外 一 一 0.5， 抽 二 0.25， 扩 一 一 0.125， 态 一 0.0625， 凡 一 

一 0.031 25， 少 一 0.015 625. 求 几 乎 具有 相同 小 权重 的 简化 模型 . 

XEN Y, =e, —e,-2 +0. 5e，:， 

(a) 求 该 过 程 的 自 协 方差 函数 ， 

(b) 证 明 其 隐藏 了 某 个 ARMAC, 0) 过 程 。 也 就 是 说 ,识别 p，9 的 值 和 0，g$ 的 值 使 
得 ARMA(), 0 过 程 拥有 与 {Y,} 相同 的 统计 特征 . 

证 明 陈述 “1 一 四 zz 一 央 寻 一 … 一 由 z2 一 0 的 根 的 绝对 值 大 于 1” 等 价 于 陈述 “xz? 一 

bx? 一 页 2 一 … 一 由 一 0 的 根 的 绝对 值 小 于 1”、《〈 提 示 : MR G 是 一 个 方程 的 根 ， 

则 1/G 是 另 一 个 方程 的 根 . ) 

假设 (Y) 是 一 个 AR(1) 过 程 ， 并 且 et 定义 (b) A b, =Y. — tY. 

(a) 证 明 Cov(b,, 6-.)=0, Wt, À. 

(b) 证 明 Cov(é,, Y.a) =0, ROO, Vi. 

A le) 为 零 均 值 、 单 位 方差 的 白 噪声 过 程 . 考虑 起 始 于 t= 二 0 如 下 递归 定义 的 过 程 : 

A Y¥,=qe, Yi=aYote, RB >l, MARZ) 过 程 一 样 ， 令 了, 二 各 Yi 十 

$V -2 tE. 

(a) 证 明 该 过 程 的 均值 为 零 . 

(b) 对 位 于 ARC) 平稳 域内 的 特殊 值 加 和 加， 该 如 何 选 择 a, cp 使 得 Var Y) = 
Var(Y,), 并且 YY MY 之 间 的 一 阶 滞后 自 相 关系 数 符合 参数 为 入 和 各 的 平稳 
AR(2) 过 程 ? 
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Cc) 一 旦 得 到 过 程 {Y,}， 那 么 如 何 将 它 转 换 成 一 个 新 的 过 程 ， 具 有 我 们 希望 的 均值 和 
方差 ? (这 个 习题 给 出 了 一 个 模拟 ARG) 过 程 的 简便 方法 , ) 
4.25 考虑 AR(1) ME, WAY. —8¥ ,十 e,， 其 中 #$ 为 任意 值 ，{e,} 是 一 个 白 噪声 过 程 ， 并 
He, 独立 于 过 去 值 (T, 13 i-Z ¢ ovat & Yo 为 均值 Po， 方差 a5 的 随机 变量 ， 
Ca) 证 明 : 当 t>0 时 ， 可 写成 
Y, = e, +per HP e tP en tete +H Yo. 
(b) WEB: 4 :>0 Hf, 有 EY,)=f'uo. 
Cc) WEAR: >00 时 ， 
p= j È 21 2 
Var(Y,) = ee sag Skeet 
ta® + of $=] 
(d 假设 po =0, WE: 如 果 (Y) Ff, 必定 有 OA. 
Ce) 仍 假设 jw =0, 证 明 ， 如 果 {Y,) 平稳 ， 则 Var(Y¥ Sia F), Albee | $| <1. 


附录 B AR(2) 过 程 的 平稳 域 
在 二 阶 模型 中 ， 容 易 求 得 二 次 特征 多 项 式 的 根 为: 


fı + yH + 4h: Bii) 
— 24, 
平稳 性 要 求 这 些 根 的 绝对 值 大 于 1， 现 在 我 们 来 证 明 当 且 仅 当 以 下 三 个 条 件 满足 时 这 个 结 
论 正确 : 


f tA <l, hA <l, | 点 | 一 1 (4, B. 2) 
WEAR: 记 特 征 根 的 倒数 为 G A Go, M: 
is 2$ _ 2$: pat vA A 
一 页 一 VAF — h JH ihl h + JH +4, 


— = 


at. (— fi + VAT Ate | E di 一 /# F Ap 
ft — (BF + 4g, ) 2 | 


类 似 地 ， 
G, = d, + VE +A 
2 


现在 我 们 依据 根 为 实数 还 是 复数 分 成 两 部 分 讨论 ， 当 且 仅 当当 十 4 由 过 0， 根 是 实数 . 
I. 实数 根 : |G, |<1, i=1, 2 当 且 仅 当 


由 一 yfi + 49, aft yti tir <1 
2 2 


—-l<= 
或 者 
一 2 一 办 一 J/# +46, <h + JH +44, <2. 
只 考虑 第 一 个 不 等 式 ， 现 有 一 2 二 办 一 JE SOF VE <b +2 SOF Ha H+ 
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dh +i 等 价 于 加 一 内 十 1 或 四 一 雁 一 1. 

类 似 地 ， 从 不 等 式 页 十 V 尖 十 4 而 一 2 可 以 推 得 h He cl. 

这 些 方程 加 上 澳 十 4 点 全 0， 定 义 了 如 图 表 4-17 所 示 特 征 根 为 实数 时 的 平稳 域 . 

I. 复数 根 : 此 时 Hteo. G AG, AHE, HAIG |=|G | 一 1 当 且 仅 当 |G | < 
1. 但 是 |G | 一 [ 览 十 (一 真一 4 屿 )] /4 一 一 上 由， 因此 宙 二 一 1， 结 合 不 等 式 澳 十 4 名 一 0， 定义 了 图 
表 4-17 所 示 特 征 根 为 复数 时 的 平稳 域 并 得 到 方程 (4. 3. 11)， 证 明 完 毕 . 


附录 C ARMA(p, q) REH AHX A 


令 (Yo AFEA ARMAC, 0 过 程 . 回忆 一 下 ， 我 们 总 可 以 将 ARMAC, q) 用 
一 般 线性 过 程 的 形式 表示 : 


Y. = eo (4, C. 1) 
其 中 由 为 权重 ， 可 以 从 方程 (4. 4. 7) 递归 求 得 ， 因 此 有 ， 
ECY wze;) = E( > je ese ) = dua: J k = 0 (4, C. 2) 


自 协 方差 系数 必须 满足 : 


q 
% = EY mY.) = E| ( DAY 一 Dobenes) Y] 
j=l j=0 
让 q 
= Oye, —¢ S38; Djs 
j=l jak 
其 中 负 二 一 1]， 当 上 有 >>g 时 最 后 的 求 和 项 消失 . W kR=0, 1 ,…, p, PA yin, BB ptl T 
关于 Yor Notts y 的 线性 方程 ， 
Yo = AN F Ay: te + $57 p — a2 (Oo + 6; bh F yy? 
Yi = Ayo FÈy te + $Y p-1 — øk (A, + Be da T geo + Gy thy 1) 


(4. C. 3) 


(4. C. 4) 


Ya = $i Yei 十 P: Yp ET $Y 0 a a, T Opti 1 
Rt H j>gq Ato, =0. 
对 于 给 定 的 一 组 参数 of, p, OGEM BM p) RERED Yo. Nn o> y 的 值 . 
当下 二 gq 时， 的 值 可 以 从 递归 方程 (4. 4. 8) RE. 最 后 从 pi 二 Xi/Yo KE poi. 
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具有 时 变 均值 的 任何 时 间 序 列 都 是 非 平稳 的 ， 形 如 
Y, = m +X, 
的 模型 (其 中 p 是 时 变 均 值 函 数 ，X, 是 零 均值 平稳 序列 ) 曾 在 第 3 章 中 讨论 过 .正如 第 3 章 
所 述 ， 仅 当 有 理由 相信 该 确定 性 趋势 “永远 ”恰当 时 ， 才 认为 该 模型 是 合理 的 .也 就 是 说 ， 仅 
因 序 列 的 一 部 分 看 似 线性 递增 (或 递减 ) 不 足以 确信 过 程 具有 内 在 的 线性 特征 ， 并 长 久保 持 下 
去 .在 众多 应 用 ， 特别 是 商业 和 经 济 学 应 用 中 ， 频 繁 出 现 的 是 无 法 对 确定 性 趋势 作出 合理 假设 
的 情况 .回顾 图 表 2- 1 中 所 示 的 随机 游 动 ， 该 时 间 序 列 似乎 存在 一 个 时 间 上 线性 的 很 强 的 上 升 
趋势 ， 但 是 如 前 所 述 ， 随 机 游 动 过 程 具有 不 变 的 零 均 值 ， 且 根本 不 会 任何 确定 性 趋势 . 

学 一 个 例子 ， 考 虑 1986 年 1 月 至 2006 年 1 月 每 桶 原油 的 月 度 价 格 。 图表 5-1 给 出 了 时 间 
序列 图 .序列 的 变动 相当 大 ， 自 2001 年 以 来 尤 甚 ， 如 此 看 来 平稳 模型 似乎 是 非 合 理 的 模型 . 
在 第 6、7 和 8 章 中 ， 将 发 现 没有 适合 此 序列 的 确定 性 趋势 模型 ， 而 一 个 含有 随机 趋势 的 非 平 
稳 模 型 才 是 适当 的 ， 本 章 就 讨论 这 类 模型 ， 值 得 庆幸 的 是 ， 很 多 具有 随机 趋势 的 序列 均 适 用 参 
数 相对 较 少 的 模型 . 


图 表 5-1 原油 月 度 价 格 : 1986 年 1 月 ~2006 年 1 月 


1990 1995 2000 2005 
年 份 


> win.graph(width=4.875,height=3,pointsize=8) 
> data(oil.price) 
> plot(oil.price, ylab='Price per Barrel',type='1') 


5. 1 通过 差分 平稳 化 
再 次 考虑 ARO) 模型 ， 
Y, = $i 二 a cS: - Le 
可 以 看 出 ， 若 假定 e 是 真正 的 “新 息 ”( 即 e 5 Yi Ye HH), 必 有 |$| 二 1. Al el S 
1， 那 么 公式 6.1.1) 的 解 是 什么 ? 特别 地 ， 考 虑 方程 
Y, = 3Y + e, (5.1. 2) 


ARIETE, XJR EMAER, RIF 
Y, = e, + 3em + 3'e to +3 e +3°Y, orl. 3) 
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可 以 看 到 ， 过 去 很 久之 前 的 Y, Se. 的 值 所 带 来 的 影响 并 没有 消失 一 一 事实 上 ，Y。 Me 的 权重 
呈 指 数 增长 . 在 图 表 5-2 中 展示 了 该 系列 很 短 的 一 个 模拟 ， 此 处 ， 白 噪声 序列 按照 标准 正 态 分 
布 变量 来 模拟 ， 同 时 以 Yo =0 为 初始 条 件 . 
图 表 5-2 WHER “AR(1)” RB Y,=3Y, +e, 的 模拟 
t | 2 3 4 5 6 7 8 
e, 0.63 -1.25 1.80 1.51 1.56 0.62 0.64 -0.98 
Y, 0.63 0.64 3.72 12.67 39.57 119.33 358.63 1074.91 


图 表 5-3 显示 了 这 个 爆炸 式 ARC) 模拟 的 时 间 序 列 图 . 
图 表 5-3 爆炸 式 的 “AR(1)” 序 列 


> data(explode.s) 
> plot (explode.s,Ylab=expression(Y[t]),type='0') 


此 模型 的 爆炸 式 行 为 也 反映 在 其 方差 和 协 方差 函数 中 ， 易 得 


Var(Y,) = (9 — Do (5, 1. 4) 
和 
CovtY, Y) = Fo — o (5.1.5) 
注意 可 以 得 到 ， 对 较 大 的 上 和 中 等 大 小 的 上 值 ， 
eh grt — ] = 
Corr(Y, Yi.) = 3 y as 1 


对 任何 满足 | 四 盖 1 的 %， 一 般 的 指数 或 者 爆炸 式 增 长 行为 都 会 出 现 ， 当 %=1 时 ， 可 得 到 
非 平稳 性 的 一 个 更 合理 的 类 型 . 424=1, ARQ) 模型 的 方程 为 


Y, 一 了 +s (5.1.6) 
这 是 第 2 章 中 讨论 的 随机 游 动 过 程 所 满足 的 关系 式 (公式 (2.2.9). 或 者 ， 可 以 重新 表示 为 
VY, =e, Colour 


其 中 VY,==Y, 一 Y, ,是 Y, 的 一 阶 差分 ， 随 机 游 动 过 程 易 被 拓展 为 更 一 般 的 模型 ， 其 一 阶 老 分 古 
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平稳 过 程 一 一 不 仅仅 是 白 噪 声 过 程 . 
在 若干 组 不 同 的 假设 下 ， 模 型 的 一 阶 差分 可 以 是 平稳 过 程 . 假设 
Y, = M,+X, (5. 1. 8) 
其 中 M, 是 随 着 时 间 缓 慢 变化 的 序列 .此 处 M, 可 能 是 确定 的 也 可 能 是 随机 的 . 如 果 假 设 M, 在 
每 两 个 连续 时 间 点 内 几乎 是 不 变 的 ， 可 以 估计 (预测 )t 时 的 M,: 选择 B,， 使 得 


yy， — Bo)? 
最 小 化 ， 显 然 得 到 ， T 
M, = +Y, +¥-1) 
t 时 刻 “ 去 趋势 ”序列 可 表示 为 
Y, — M, =Y, — 4Y, +Y) = 4Y, — Y.) = 4 VY, 


这 是 常数 和 一 次 差分 YY,S 的 乘积 . 
第 二 个 假设 是 方程 (5. 1. 8) 中 的 M, 是 由 随机 游 动 模型 支配 的 随机 的 并 且 随 时 间 缓 慢 变 
化 的 序列 ， 例 如， 假设 
Y, 一 M 二 el，M, 一 M 十 gs (5. 1. 9) 
其 中 (e) 和 (e) 是 独立 的 白 噪 声 序 列 . 则 
VY, =V M, +V e, =e, te, — em 
该 序列 有 MA(1) 序列 的 自 相关 函数 ， 表 示 为 
p =— {1/[2 + (o /o?) 1} (5. 1. 10) 
无 论 何 种 情况 下 ， 都 将 引 向 对 作为 平稳 过 程 的 YY 的 研究 . 
回 到 石油 价格 序列 ， 图 表 5-4 呈现 了 该 序列 对 数 差 分 的 时 间 序 列 图 2. 与 图 表 5-1 显示 的 
原 时 间 序 列 相 比 ， 差 分 后 的 序列 看 起 来 更 平稳 . 〈 后 面 还 会 发 现 ， 该 序列 存在 异常 值 ， 这 一 点 
在 构建 更 恰当 的 模型 时 应 当 予 以 考虑 . ) 


图 表 5-4 石油 价格 序列 取 对 数 后 的 差分 时 序 图 


Log〔 价 格 ) 增 量 
全 
一 


-0.4 


1990 1995 2000 2005 


> plot (diff (log(oil.price)),ylab='Change in Log(Price)',type=‘1') 


O ”更 完整 的 说 法 是 ， 兴 后 长 度 为 工时 的 一 阶 差分 . 
O ”5.4 节 将 讨论 为 什么 求 对 数 会 是 一 种 能 带 来 便利 的 转换 . 


还 可 以 设 定 一 些 假设 ， 以 得 出 平稳 的 二 次 差分 模型 .再 次 假设 方程 〈5.1.8) Mar, AR 
在 假设 M, 在 时 域 的 三 个 连续 时 点 上 是 线性 的 ， 通 过 选择 B,, 和 Bi,, 以 最 小 化 下 式 ， 可 以 估计 
(iM) PELA z FRYM.: 


1 


(CY j ~~ (Bove + jBi,.)° 
1 


了 一 


求解 得 出 
M, = 本 (Yo Eo, Ae oe 


因此 去 趋势 序列 为 


Y,—M,=y,— (744-4 ies) z (-+ 


3 ) (Yt — rA + + ee 


= (-$) VV Yad = (4) V Ya) 


是 某 常数 与 Y, 的 中 心 二 次 差分 的 乘积 ， 注意 已 差分 了 两 次 ， 但 都 是 在 滞后 1 上 的 差分 . 
另外 的 做 法 是 ， 还 可 假设 

Y, =M, +e, 其 中 NM, = Ma We W, =W te (5.1.11) 
其 中 (e) 和 (e) 是 独立 的 白 品 声 序列 .这 里 随机 趋势 M, 的 “变化 率 ”V M, 在 时 域 上 是 慢 
变 的 .， 则 

VY, =VM,+Ve =W,+Ve, 
和 
WY, =VW,+tV2e, = e, + (e, — e1) — (leri ~ enz) = €: + e — 2em tere 

这 是 具有 MA(2) 过 程 的 自 相 关 函 数 . 重要 之 处 在 于 ， 非 平稳 过 程 (Y) 经 二 次 差分 后 变 成 平 
稳 的 了 .这 就 导出 了 重要 的 自 回归 滑动 平均 求 和 时 间 序 列 模型 的 一 般 定 义 . 


5.2 ARIMA 模型 


如 果 一 个 时 间 序 列 {Y,} 的 a 次 差分 WL=VY, 是 一 个 平稳 的 ARMA ME, WH {Y,} 
为 自 回 归 滑 动 平均 求 和 模型 如果 W, 服从 ARMAC, q) 模型 ， 我 们 称 (Y) 是 ARIMA(z， 
d, q4) 过 程 . 幸 好， 实际 上 上， 通常 取 d= 二 1 或 最 多 为 2. 

下 面 考虑 ARIMA(p，、1，9g) 过 程 . FW.=Y,-Y.1, RNA 


W, = Wei HPW +e HEW op ber — Oren — Oem 一 一 办 cv Caza ) 
或 者 用 观测 序列 符号 来 表示 : 
Y 一 了 _ |， =f, (Ve. — Y2) +$: (Y2 — Yes) + ooo + Yep — Yep) 
+ e, — Âe — Orer-2 — *** — Oye i 
该 式 子 可 以 改写 成 
Y, =(1 +4, Yeni + (he — #1) Yen 十 (加 一 各 )Y ;十 ，… (5. 2. 2) 
+ CA, — $1) Ve» — DY epi F e — Neer — Orem — °° — Ogea 


我 们 称 其 为 模型 的 差分 方程 形式 ， 注意， 该 表达 式 看 起 来 是 一 个 ARMA(p 十 1，gq) TH. R 
而 ， 容 易 验 证 ， 其 特征 多 项 式 满足 
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1—(+4)2— (& —t)2°—h — ht — eo — &, — 8-1) 2? + 8,2"" 
=(1 — $z — fz’ — + — $7?) (1—2z) 
该 因子 分 解 显 然 说 明 z= 1 是 一 个 根 ， 意味 着 这 个 过 程 非 平稳 但 是 ， 其 余 的 根 是 平稳 过 程 
VY 了, 特征 多 项 式 的 根 . 

相 比 平稳 的 情况 ， 这 里 用 W, BOW. 中 的 和 白 品 声 项 来 明确 表示 观测 序列 更 为 困难 . 由 于 非 
平稳 过 程 不 在 统计 平衡 点 上 ， 所 以 不 能 假设 模型 可 向 过 去 方向 无 限 延 伸 ， 或 是 从 二 一 cc 开始 . 
但 是 ， 可 以 且 应 假设 模型 自 某 时 点 (例如 t= 一 m) 开始 ， 其 中 一 m 早 于 上 一 1， 为 序列 的 首次 
观测 时 间 . 为 了 方便 ， 当 t= 一 m 时 取 Y, 二 0.。 把 差分 方程 Y, 一 了 ,1 二 W, 的 两 边 分 别 从 t= 二 一 m 
到 :一 上 求 和 ， 可 解 得 ARIMA(b，1，9) 过 程 的 表达 式 为 


Y, = Èv, (5. 2. 3) 
类 似 地 ， 可 通过 两 次 求 和 处 理 ARIMACp, 2, 9) 过 程 ， 得 到 表达 式 
Y=) Dw. = Yatpw., (5. 2. 4) 


j=-m i=-m 


这 些 表示 作用 有 限 ， 但 可 用 来 研究 ARIMA 模型 的 协 方差 特征 ， 还 可 以 用 白 噪 声 过 程 (e) 来 
表示 Y,。 相 关 计 算 迟 至 评估 特例 时 再 给 出 ， 
如 果 过 程 不 包含 自 回 归 项 ,我 们 称 其 为 滑动 平均 求 和 过 程 ， 缩 写 为 IMA(d，g). MRE 
有 滑动 平均 项 ， 则 记 此 模型 为 ARI(p，d). 我 们 首先 详细 讨论 重要 的 IMA(1，1) RA. 
IMA{1，1) 模型 
简单 的 IMA(1，1) 模型 代表 了 许多 时 间 序 列 ， 尤 其 是 那些 在 经 济 和 商业 中 产生 的 序列 . 
用 差分 方程 的 形式 ， 模 型 为 
Y, = Yı +e, — ĝem (5. 2. 5) 
为 了 将 Y, 明确 表示 成 白 噪 声 现 值 和 滞后 值 的 函数 ， 根 据 方程 〈5. 2. 3) 和 这 种 情况 下 的 事实 
W,=e,—Ge,-1. 简单 整理 后 得 到 : 
Y, = e, + O — Qeni + (1 — Mere +o + (1 — Dem 一 0e-。; (5. 2. 6) 
注意 ， 与 平稳 ARMA 模型 相 比 ， 白 品 声 项 的 权重 并 不 会 随 着 滞后 逐渐 消失 . 由 于 假设 一 m 一 
1，0 一 上 +， 通常 可 以 实用 地 将 Y, 视 为 大 量 白 噪声 项 取 值 的 等 权 和 . 
从 方程 6.2.6) 可 以 容易 地 推导 出 方差 和 相关 系数 ， 我 们 有 


Var(Y,) = [1+ E + 0—0 t+ m) jo i Game. 7) 
并 且 对 较 大 的 m 和 中 等 大 小 的 &， 
he lin sk nd) Utm ... Ee 
Corr(Y, Yea) [ Var(Y,) Var(Y,,) |!” t+m (5. 2. 8) 


a 1 . 
可 见 当 上 增加 时 ，Var(Y,) 会 随 着 增加 ， 并 无 限 增 大 . 同时， 对 多 个 滞后 期 数 k=1, 25-5, 
和 Y,-, 的 相关 系数 呈现 高 度 正 相关 . 
IMA(2, 2) 模型 


方程 (5.1.11) 的 假设 可 以 得 到 IMA(2，2) 模型 ， 用 差分 方程 表示 ， 我 们 有 
V?Y, ee | — Oe, 1 — hze 
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或 
LZ = AE ~~ i 十 È: Z die 下 Oy €z (5. 2.9) 
可 以 使 用 方程 (5. 2s 4) ’ 用 Bry Eis A E ER Ya 经 过 繁琐 的 代数 变换 ， 得 到 


thm 
Y: = E; 十 Per; = [+m + 1)é; + (¢+m)é, le a] 一 (t+ m 十 1) Gs en —2 C5. oe 10) 
j=l 


其 中 当 j=l, 2, 8,0, t+mit, $=14+0+0-4—-6)). AREAK, p MRHASE 
MAA, MERA TRA RHE R BI SK. 
Y, 的 方差 和 相关 系数 都 可 以 通过 方程 (5. 2.10) 求 得 ， 但 是 计算 很 繁琐 .这 里 只 是 简单 地 指 
出 ，Y, 的 方差 随 上 迅速 增长 ， 且 对 于 所 有 中 等 大 小 的 & 值 ，Corr(Y, ，Y -+*) 再 次 近似 为 1， 
图 表 5-5 显示 了 IMAC, D) 过 程 的 模拟 结果 . 注意 该 过 程 数值 变化 非常 平滑 MFE 
函数 无 关 紧 要 )， 逐 渐 增 加 的 方差 和 邻近 相关 系数 的 强 正 相关 性 决定 了 这 个 时 间 序 列 图 的 走势. 
”图 表 5-5 6,=1, 6.=—0.6 BY IMA(2, 2) 序列 的 模拟 图 


0 10 20 30 40 50 60 
时 间 


> data(ima22.s) 
> plot (ima22.s,ylab='IMA(2,2) Simulation',type='o') 


图 表 5-6 显示 了 模拟 序列 的 一 次 差分 的 时 间 序 列 图 ， 该 序列 也 是 非 平 稳 的 ， 因 为 它 由 
IMA(1, 2) 模型 决定 . 
图 表 5-6 ”模拟 的 IMA{2，2) 序列 的 一 次 差分 


40 50 60 


0 10 20 30 
时 间 


> plot (diff (ima22.s),ylab='First bifference',type='0') 


最 后 ， 图 表 5-7 描述 了 模拟 的 IMA(2，2) 序列 的 二 次 差分 ， 这 些 值 取 自 = 二 1, Z=—0.6 
时 的 平稳 MAC) 模型 ， 根 据 方程 (4. 2. 3)， 该 模型 的 理论 自 相 关系 数 为 p = —0.678, o5 
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0. 254， 时 间 序 列 图 的 走势 可 以 反映 出 这 些 相关 系数 值 
图 表 5-7 模拟 的 IMA(2，2) 序列 的 二 次 差分 


10 20 30 40 50 60 
时 间 


> plot (diff (ima22.s,difference=2) ,ylab='Differenced 
Twice',type='o') 


ARI (1, 1) 模型 
ARIC, 1) 过 程 满足 
Y, 一 Y = $Y —Y-2) +e, (6; 2.193 
或 
Y, = A +Y — #¥-2 +, (5. 2. 12) 
其 中 1$ <12. 


为 了 求 出 这 个 情况 下 的 由 权重 ， 需 要 运用 一 个 可 以 推广 至 任意 ARIMA 模型 的 技巧 ， 可 以 
RR, 山 权 重 可 以 通过 令 等 式 两 边 zx 的 相同 次 客 相 等 求 出 : 


(1— $2 — box? — os pr a t+ part pr + pir? +o) ree, 
= (1— bz — hz — hz — = — 8.2") 
在 该 例 中 ， 关 系 式 简化 为 : 
Q— pr) r) ++ hrt pr tpr 十 "…) 二 1 
或 
1 Aa Arter A H part pr H pr Hee) =l 
令 两 边 zx 的 相同 次 星相 等 ， 得 到 
— (1+9) +h =0 
$—U +p tph = 0 
一 般 地 ， | 
be = 148 ber — fhas RD? (5. 2. 14) 


其 中 w=1， 二 1 十 # 该 递归 方程 以 及 初始 值 使 我 们 可 以 计算 出 任意 必要 的 权重， 也 可 证 
明 ， 在 这 个 情况 下 ， 递 归 方 程 的 显示 解 可 以 表示 为 


昌 ”、 注 意 该 模型 看 起 来 像 一 特殊 的 ARC) MM. 但是， 相应 的 AR(2) 特征 多 项 式 的 一 个 根 是 1， 这 在 平稳 AR(2) 模 
型 中 是 不 允许 的 . 
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1—¢ 
a Fae k >l (5. 2. 15) 


(这 很 简单 ， 例 如 ， 证 明 该 表达 式 满足 方程 (5. 2.14)). 


5.3 ARIMA 模型 中 的 常数 项 


对 于 ARIMA(p, d, q) RH, VY, =W, 是 平稳 的 ARMA(p，g) 过 程 . 标准 的 假设 是 
平稳 模型 有 一 个 零 均 值 ， 即 实际 上 我 们 研究 的 是 相对 常数 均值 的 偏离 值 . 平稳 ARMA 模型 
(Wo 中 的 非 零 常数 均值 y 可 以 通过 两 种 方法 体现 在 模型 中 ， 我 们 可 以 假设 

W, TH =f, (W. — p) + $, CW,» cae tert $(W —p) 


+ e, a Oien a zez Tena? = 
或 者 ， 可 以 把 常数 项 0, 引入 模型 如 下 : 
W, = bo 十 $W 十 PW ,.， + aie + $W -p 十 | -一 Oien == Ore =— so Of me 


对 后 一 个 表达 式 两 边 求 期 望 ， 得 到 
p= hth th te + Ppp 
因此 


= ĝo 
A T =e T A (5. 3. 1) 


或 者 
A = w(1 — 4 — $2 — + — py) (5. 3. 2) 
由 于 两 个 替代 表达 式 是 等 价 的 ， 我 们 可 以 使 用 任何 一 种 形式 ， 只 要 参数 化 简便 即 可 . 
W, 的 非 零 均值 对 未 差分 序列 Y, 有 什么 影响 ? 考虑 有 常数 项 的 IMAC, 1). RNA 
Y, = Yı +& +e, — ĝem: 
或 者 
W, = bh +e, — ĝem 
代入 方程 (5. 2. 3)， 或 后 向 迭代 ， 得 到 
Y, =e, 十 (1 一 0)e- + (1 — Men. 十 … 十 (1 一 0)e — Gene 
+(t+m+1)4@ 
与 方程 6.2.6) 相 比 ， 我 们 发 现 多 了 具有 斜率 O 的 线性 确定 时 间 趋 势 项 〈t 十 im 十 1)6。. 
因此 ， 该 过 程 的 一 个 等 价 表 达 式 是 
Y, = Yi+ h + Bt 
Hth Y, Æ IMAC, 1) FS, ECVY.)=0, ECVY,) =f. 
对 于 一 般 的 ARIMA( p, d, g@ MA, EVY, ) 40, WUC Y, =Y Hue, hy, 是 d 阶 的 确 
定 趋势 多 项 式 ，Y' 是 EY, =0 的 ARIMACp, d, q) 模型 . 当 d 一 2，4 天 0 时 ， 隐 示 了 二 次 趋势 . 


(5. 3. 3) 


5.4 其 他 变换 


我 们 已 经 看 到 差分 是 实现 平稳 性 的 有 用 的 变换 方法 . 然而 ， 在 某 些 情况 下 对 数 变换 也 是 有 
效 的 方法 .经 常会 碰 到 如 下 的 序列 ， 其 散 度 变 大 似乎 与 序列 值 的 增加 有 关联 一 一 序列 的 值 越 
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大 ， 围 绕 该 值 的 波动 就 越 大 ， 反 之 亦 然 . 
特别 是 ， 假 设 对 YL 上 有 六 >0， 以 及 


E(Y,) = ms, VVar(Yy,) = po (5. 4. 1) 
WA 
E(Llog(Y,) ] ~ log(y), VarClog(Y,)) = ø (5. 4. 2) 


对 如 下 (泰勒 ) 展开 式 两 边 取 期 望 和 方差 ， 可 得 出 上 述 结果 : 
log(Y,) =~ logu) + ml 


即 如 果 该 序列 标准 差 与 该 序列 的 水 平 值 成 正比 ， 则 对 数 变换 将 产生 随 着 时 间 变 化 方差 约 为 常数 的 
序列 ， 并且， 如 果 该 序列 水 平 值 大 致 呈 指 数 变 化 ， 则 对 数 变换 后 的 序列 将 呈现 线性 时 间 趋 势 . A 
此 ， 接 下 来 我 们 可 能 要 进行 一 次 差分 ， 这 将 得 出 对 取 对 数 后 的 数据 进行 差分 的 另外 一 组 假设 . 
百分比 变动 和 对 数 
假设 从 一 个 时 期 到 下 一 个 时 期 ，Y, 趋向 于 存在 相对 稳定 的 百分比 变化 ， 具体 地 说 ， 假 设 
b a (1 + X.)Y mi 
其 中 100X, Æ Y ZY, 的 百分比 变化 〈 可 能 为 负数 )， 则 


log(Y,) — log(¥ mı) = log( z“) = log(1 + X.) 
+l 


mse X,, Ain, |X. <0.2 ( 即 百 分 比 变化 最 多 为 十 20%)， 则 可 得 到 一 个 良好 的 通 近 ， 
logd +X) =X. Al, 
VLlog(Y,)] ~ X, (5. 4. 3) 
将 相对 稳定 ， 可 能 用 平稳 过 程 可 以 很 好 地 拟 合 ， 注意 我 们 先 取 对 数 ， 然 后 再 计算 一 次 差分 一 一 
阶 数 并 不 重要 ， 在 金融 文献 中 ，( 自 然 ) 对 数 的 差分 通常 被 称 为 收益 率 . 
作为 一 个 例子 ， 考 虑 图 表 5-8 所 示 的 时 间 序 列 ， 该 序列 给 出 了 美国 总 的 月 度 发 电量 ， 以 百 
万 千瓦 小 时 为 单位 ， 较 高 的 值 与 较 低 的 值 相 比 显示 出 更 大 的 波动 . 


图 表 5-8 美国 月 度 发 电量 


1975 1980 1985 1990 1995 2000 2005 
年 份 


> data (electricity); plot (electricity) 


图 表 5-9 显示 了 对 发 电量 取 对 数 后 的 时 间 序 列 图 ， 注 意 现在 围绕 上 升 趋势 的 波动 ， 从 序列 
的 高 值 到 低 值 更 加 均匀 . 
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图 表 5-9 发 电量 取 对 数 后 的 时 间 序 列 图 


w 

P 

qa 

p 

= 
ae 

1975 1980 1985 (090 

年 份 


> plot (log{electricity) ,ylab='Log(electricity) ') 


发 电量 取 对 数 后 的 差分 结果 显示 在 图 表 5-10 中 ， 根 据 这 个 图 形 ， 我 们 会 认为 平稳 模型 是 
适当 的 . 


图 表 5-10 发 电量 对 数 差分 的 时 间 序 列 图 


1975 1980 1985 1990 1995 2000 2005 
年 份 


> plot (diff (log {telectricity)}, 
ylab='Difference of Log(electricity) ') 


TEIR 
Box 和 Cox(1964) 介绍 了 一 种 灵活 的 转换 ， 即 寡 变 换 . 给 定 参 数 4 值 ， 变 换 定 义 为 
r — 1 
g(x) = A Bie (5. 4, 4) 
logr A=0O 


r 项 是 第 一 个 表达 式 中 重要 的 组 成 部 分 ， 但 是 将 其 减 去 1 再 除 以 4 可 令 g(z) 在 4 趋 于 零 时 平 
滑 变 化 ， 实 际 上 ， 通 过 微 积 分 方法 可 以 证 明 e ,A 一 0 时 (x*—1)/A>log( x). TER, A=1/2 得 
到 开 方 变换 ， 对 类 似 泊 松 分 布 的 数据 非常 有 用 ，)?= 一 1 对 应 的 是 倒数 变换 . 


O 习题 5.17 要 求证 明 这 个 论点 ， 
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577A BE (A aE RE EE ER. 假如 一 些 数据 是 负数 或 者 是 零 ， 那 么 在 大 变换 前 ， 需 
要 在 所 有 数值 上 加 一 个 正 数 ， 使 得 所 有 数据 为 正 ， 这 种 移动 往往 是 主观 确定 的 例如， 对 于 生 
物 学 上 非 负 的 捕获 数据 ， 对 于 零 值 的 出 现 经 常 通过 增加 一 个 常数 来 处 理 ， 该 常数 等 于 所 有 数据 
中 最 小 的 正 数 . 另 一 种 方法 是 使 用 适用 于 任何 数据 的 变换 一 一 无 论 正 数 与 否 . 这 种 替代 方法 的 
一 个 缺点 是 ， 对 它 的 解释 不 如 对 宕 变换 的 解 肢 iets aan 
来 得 直观 ， 参 阅 Yeo 和 Johnson(2000) 及 其 
中 记载 的 参考 文献 . 

我 们 可 以 把 4 作为 模型 中 额外 的 参数 ， 用 
观测 数据 来 估计 . 然而， 通常 不 能 保证 得 到 A 
的 准确 估计 ， 基 于 4 值 (例如 士 ]， 土 1/2， 
土 1/3， 土 1/4，0) 的 网 格 的 一 系列 变换 的 评 
价 已 经 足够 ， 而 且 还 直观 ， 

软件 允许 我 们 考虑 一 系列 4 值 ， 对 给 定 的 
A 值 计算 基于 正 态 分 布 的 似 然 函数 的 对 数 似 然 
函数 值 ， 图 表 5-11 显示 了 对 电量 数据 计算 的 
这 些 值 ，4 的 95% 的 置信 区 间 包 含 了 4 二 0， 并 
Haso 接近 中 间 的 位 置 ， 所 以 强烈 建议 对 数 > BoxCox.ar (electricity) 
据 进行 对 数 变换 (4 二 0). 


5.5 小 结 


为 从 非 平稳 过 程 中 导出 平稳 性 ， 本 章 引 入 了 差分 的 概念 ， 进 而 介绍 了 重要 的 自 回归 滑动 
平均 求 和 模型 (ARIMA) ， 并 深入 分 析 了 这 些 模 型 的 性 质 ， 然 后 讨论 了 百分比 和 对 数 变 换 等 
其 他 变换 。 Be, PAT RPM Box-Cox 变换 ， 用 以 得 到 平稳 性 ， 并 且 可 以 得 到 正 
态 特 性 . 


习题 
5.1 识别 下 列 模型 具体 的 ARIMA ÉR, Mp, d, 分 别 是 多 少 ， 参 数值 GAO ITA? 
(a) 了 一 了 1 一 0 25Y， te, — 0. 1e 
(b) Y,=2Y,-1—Y.-2 te, 
(c) Y, =0. 5Y,-, —0. 5Y,- te, —0. 54,21 10. 256,3 
5.2 对 下 列 每 个 ARIMA 模型 ， 求 EC(VY,) 和 VarVY,). 
(a) Y,=34+Y,., te,—0. 756-1 
(b Y,=10+1. 25Y 21 —0. 25Y 9 te — 0. le,- 
(O Y¥,=5+2Y,_,—1. 7Y,-2 +0. 7Y,-3 te, — 0. 5e,1 +0. 25¢e,-2 
5.3 假设 {Y,) WE: Y, =e, tce, tce: tees Fe tee, t0. 
(a) 求 {Y,) WMA eM. (Y) 是 否 平稳 ? 
(b) R (VY) 的 均值 和 协 方差 函数 ，(VY,) 是 否 平稳 ? 


un un 
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(c) 识别 {Y,} 具体 的 ARIMA 形式 ， 

5.4 假设 Y,==A 十 Bt 十 X,， 其 中 X, 是 随机 游 动 。 首先 假 设 A MB 为 常数 . 

(a) {Y,) FE. 

(b>) (VY) ETTR. 

现在 假设 A AB 是 独立 于 随机 游 动 (X) 的 随机 变量 . 

Cc) (Y) ERTH. 

(d) {YY,} 是 否 平稳 . 

.5 使 用 图 表 5-2 中 模拟 的 白 噪声 值 ， 验 证 爆炸 过 程 Y, 的 所 示 值 . 

.6 考虑 平稳 过 程 {1Y,}， wel: 当 o 过 1/2 tf., VY, 的 方差 比 Y, 的 大 . 

.7 考虑 两 个 模型 

A; Y,=0. 9Y, +0. 09Y,-: +e. 

B; Y, =Y —, te, — 0. le-;. 

(a) 识别 每 个 模型 具体 的 ARIMA ÉA. Bp, d, 9g 分别 是 多 少 ， 参 数值 和 6 是 什么 ? 

(b) 什么 情况 下 两 个 模型 会 不 同 ? 

(c) 什么 情况 下 两 个 模型 会 相似 ?比较 由 权重 和 x 权重.) 

.8 BEFFE “ARU” HH, BAREA If >L 时 方程 6.1.2) 的 解 ， 

(a) 对 这 个 更 一 般 的 情况 ， 推 导出 类 似 方程 〈5. 1. 3) HB. AY. 一 0 作为 初始 条 件 ， 

(b 对 这 个 更 一 般 的 情况 ， 推 导出 类 似 方程 (5. 1. 4) 的 方程 . 

(co) 对 这 个 更 一 般 的 情况， 推导 出 类 似 方程 (5. 1, 5) 的 方程 

(d) HER | 二 1 以 及 较 大 的 上 和 中 等 大 小 的 &，Corr(7Y ，Y -os1 是否 正 确 ? 

.9 证 明 方程 (5. 1. 10) Mow. 

10 46°F ARIMA 序列 可 以 由 以 下 方法 模拟 : 首先 模拟 相应 的 平稳 ARMA 系列 ， 然 后 对 
E SRA” (实际 上 部 分 求 和 )， 使 用 统计 软件 来 模拟 具有 不 同 参 数值 的 各 种 IMA 的 
d, D 和 IMA(2，2) 序列 . 注意 在 这 些 模 拟 序列 中 出 现 的 任何 随机 “趋势 ”. 

.11 数据 文件 winnebago 包含 了 1966 Æ 11 月 至 1972 年 2 H Winnebago 公司 休闲 车 (RV) 

的 每 月 销售 量 . 

Ca) 画 出 这 些 数据 的 时 间 序 列 图 并 进行 阐释 . 

(b 现在 ， 对 月 度 销售 量 求 自然 对 数 ， 并 画 出 变换 后 数据 的 时 间 序 列 图 ， 描 述 对 数 变 换 
对 这 个 序列 走势 的 影响 . 

(c) 计算 用 小 数 表示 的 相对 变化 率 (Y, 一 Y, 1)/Y,,， 并 与 (自然) 对 数 的 差分 VY log (Y,) = 
log(Y,) —log(¥,-.) 进行 比较 当 数 值 较 小 和 较 大 时 ， 两 者 的 对 比 结果 如 何 ? 

,12 数据 文件 SP 包含 了 从 1936 年 第 1 季度 至 1977 年 第 4 季度 的 季度 股票 价格 的 标准 普尔 

综合 指数 ， 

Ca) 画 出 这 些 数 据 的 时 间 序 列 图 并 进行 阐释 . 

(b) 现在 ， 对 季度 数据 求 自 然 对 数 ， 并 画 出 变换 后 数据 的 时 间 序 列 图 ,描述 对 数 变换 对 
这 个 序列 走势 的 影响 . 

(c) 计算 (用 小 数 表 示 的 ) 相对 变化 率 (Y, — Y/Y as 并 与 (自然 ) 对 数 的 差分 
Vlog(Y,) 二 log(Y,) 一 log(Y,_1) 进行 比较 ， 当 数值 较 小 和 较 大 时 ， 两 者 的 对 比 结果 如 何 ? 
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5.13 


5.17 


数据 文件 airpass 包含 了 1960 € 1 A Æ 1971 年 12 月 月 度 国际 航班 乘客 数量 (单位 干 

人 )， 这 是 Box 和 Jenkins(1976) 中 分 析 过 的 一 个 典型 的 时 间 序 列 . 

Ca) 画 出 这 些 数据 的 时 间 序 列 图 并 进行 阐释 . 

(b) 现在 ， 对 月 度数 据 求 自 然 对 数 ， 并 画 出 变换 后 数据 的 时 间 序 列 图 . 描述 对 数 变 换 对 
这 个 序列 走势 的 影响 . 

(c) 计算 (用 小 数 表 示 的 ) 相对 变化 率 (YY 一 Y,_1)/Y,_1， 并 与 (自然) 对 数 的 差分 
V log(Y,) 二 log(Y,) 一 log(Y,-1) 进行 比较 ， 当 数值 较 小 和 较 大 时 ， 两 者 的 对 比 结果 如 何 ? 

考虑 图 表 1-1 显示 的 洛杉矶 年 度 降 雨量 数据 ， 图 表 3-17 所 示 的 正 态 分 位 数 一 分 位 数 图 说 

明 该 组 数据 不 服从 正 态 分 布 ， 数 据 在 文件 larain F. 

(a) 用 软件 画 出 与 图 表 5-11 类 似 的 图 形 ， 确 定 对 数据 进行 短 变 换 的 最 优 值 . 

(b) 对 变换 后 的 数据 画 出 分 位 数 一 分 位 数 图 ， 这 时 的 图 形 是 否 更 接近 正 态 分 布 ? 

Cc) 画 出 变换 后 数据 的 时 间 序 列 图 . 

(d 仿照 图 表 1-2， 用 变换 后 的 数据 画 出 Y, SY NRA. 能 和 否 期 望 该 变换 改变 序列 
的 相依 性 抑或 相依 性 缺失 的 状态 ? 

名 为 J 的 数据 文件 包含 了 强生 公司 每 股 收益 的 季度 数据 时间 跨 度 从 1960 年 到 

1980 年 ， 

Ca) 画 出 数据 的 时 间 序 列 图 ， 并 冰释 其 中 有 趣 的 特征 . 

(b 用 软件 画 出 与 图 表 5-11 类 似 的 图 形 ， 确 定 对 数据 进行 究 变 换 的 最 优 4 值 . 

(c) 画 出 变换 后 的 数据 的 时 间 序 列 图 ， 该 图 形 能 否 得 出 平稳 模型 适用 的 结论 ? 

(d 把 变换 后 的 数据 进行 差分 ， 画 出 时 间 序 列 图 ， 由 图 能 和 否 得 出 差分 后 的 序列 适用 平稳 
模型 ? 

名 为 gold 的 数据 文件 包含 了 2005 年 252 个 交易 日 每 日 的 黄金 价格 (单位 ， E/R). 

Ca) 夯 出 数据 的 时 间 序 列 图 并 阐释 图 表 ， 

(b) 求 数据 的 对 数 差 分 ， 画 出 时 间 序 列 图 . 

(c) 计算 并 展示 对 数 差 分 数据 的 样本 ACF， 并 说 明 对 数 数据 似乎 遵循 随机 游 动 模型 ， 

Cd) 画 出 并 解释 对 数 差 分 数据 的 直方 图 ， 

Ce) 画 出 并 解释 对 数 差 分 数据 的 正 态 分 位 数 -分 位 数 图 . 

用 微 积 分 证 明 ， 对 于 任意 固定 的 >00, A0 ht, (—1)/A—logr. 


附录 D 延迟 算 子 


许多 其 他 书籍 和 时 间 序 列 的 文献 用 所 谓 的 延迟 算 子 去 表示 和 处 理 ARIMA 模型 。 延迟 算 子 


(Backshift operator)， 记 为 B， 作 用 于 序列 的 时 间 指 标 ， 令 时 间 向 后 倒退 一 个 时 期 形成 一 个 新 
的 序列 .特别 地 ， 


BY, = tl 


Ə 


B 有 时 也 被 称 为 滞后 算 子 ‘Lag operator). 
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BlaY, + 6X,+c¢) = aBY, + 6BX,+¢ 
现在 考虑 MA(1) RA. H B 来 表示 ， 我 们 可 以 写成 
Y, = e, — ĝe, = e, — btBe, = (1 — 0B)e, = 0( B)e, 
HP oB) 是 在 B 上 所 “评估 ”的 MA 的 特征 多 项 式 . 
因为 BY 自身 是 个 时 间 序 列 ，BBY, 也 是 有 意义 的 ， BR BBY,—BY,.=Y,-., TURK 


B'Y, = Y, 

更 一 般 地 ， 我 们 有 
HY 

对 任意 正 整 数 m 成 立 ， 对 一 般 的 MA(g) 模型 ， 我 们 可 写成 

Y= e, — er — bzem: — *** — be, = e, — O Be, — 0, B’ e, — ++ — 0,B%e, 
= (1—6,B—6,B* — =. — 6,B")e, 

或 者 

Y, = Bde, 


其 中 oB) 仍 是 在 已 上 所 评估 的 MA 的 特征 多 项 式 . 
对 自 回归 模型 AR(p)， 我 们 首先 把 所 有 有 关 Y 的 项 移 到 左边 : 


一 有 一 $Y» = €; 
整理 为 
Y, — $, BY, — $: B?Y, — + —$,B’Y, = e, 
或 者 
(TB = 9 — 9,8" m « 
可 表示 为 
$CB)Y, = e, 


其 中 $(B，〉 是 在 B 上 所 评估 的 AR 的 特征 多 项 式 . 
合并 两 个 模型 ， 一 般 ARMA(p，g) 模型 可 以 简 记 为 : 
$B)Y, = 0(B)e, 
差分 也 可 以 方便 地 用 符号 BERR. RNA 
VY, = Y,— Y., = Y, — BY, = (1— BY, 
二 次 差分 表示 为 
VY, = (1 — B)2Y， 
实际 上 , V=1—B, Vi=(1—B)*. 
一 般 ARIMA(p, d, q) 模型 可 以 简洁 地 表示 为 
$(B)(1— B)’Y, = 0(B)e, 
在 文献 中 ， 需 要 根据 上 下 文 仔细 区 分 B 的 用 法 是 作为 延迟 算 子 还 是 作为 一 个 普通 的 实 
(或 复 ) 变量 ， 例 如 ， 平 稳 条 件 经 常 被 表述 为 $B) =0 的 根 的 绝对 值 必须 大 于 1， 或 等 价 地 在 
复 平 面 上 必须 在 单位 圆 外 .此 时 B 是 被 当做 方程 中 虚拟 的 变量 ， 而 不 是 延迟 算 子 . 
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对 于 平稳 和 非 平稳 时 间 序 列 ， 我 们 已 经 开发 出 一 大 类 参数 模型 一 一 ARIMA 模型 .现在 我 
们 开始 针对 这 些 模 型 进行 研究 并 且 实 施 统计 推断 。 接 下 来 三 章 的 内 容 分 别 是 : 

1. 对 于 给 定 的 时 间 序 列 ， 如 何 选取 适当 的 p，d，g ff. 

2. 如 何 估计 一 个 识别 的 ARIMA(p，d，g) 模型 的 参数 . 

3. 如 何 检验 拟 合 模 型 的 适当 性 并 且 在 需要 的 时 候 改进 该 模型 . 

我 们 总 的 策略 是 ; 首先 ， 确定 合理 的 但 为 尝试 性 的 p，d 和 9g 值 . 然后， 用 最 有 效 的 方法 
估计 该 模型 中 的 $，9 和 vc.， 最 后 严格 审查 得 到 的 拟 合 模 型 ， 用 类 似 于 3.6 节 的 方法 检验 该 模 
型 拟 合 的 充分 性 ， 如 果 在 某 些 方面 模型 拟 合 不 充分 ， 便 利用 不 充分 的 性 质 来 选择 另外 的 模型 . 
我 们 继续 估计 新 的 模型 并 检验 其 充分 性 . 

按照 这 种 建 模 策略 重复 几 次 之 后 ， 对 于 给 定 的 时 间 序 列 ， 我 们 希望 能 得 到 可 能 的 最 优 模型 . 
George E. P. Box 和 G. M. Jenkins(1976) 所 著 的 书 使 得 该 方法 非常 流行 ， 以 至 于 许多 读者 称 这 一 
过 程 为 “BoxJenkins F”. 我们 通过 继续 研究 样本 自 相 关 函 数 的 性 质 开 始 本 章 的 介绍 . 


6.1 样本 自 相 关 函 数 的 性 质 
回顾 样本 或 估计 的 自 相关 函数 的 定义 ， 对 于 观测 序列 Yl，Y。,…, Yn RIIA 
>» Y. —Y)Y m — Y) 
n = A _________., k=l, 2e (6.1.1) 
DY, -¥)? 

我 们 的 目标 是 尽 可 能 地 识别 出 的 模式 ， 该 模式 具有 普通 ARMA 模型 we 的 已 知 模式 的 特 
点 ， 例 如， 我们 知道 在 MA(g)〉 RHP, 4kogh, o =0. 但 是 ， 由 于 rs 只 是 ps 的 估计 量 ， 
所 以 需要 研究 它们 的 采样 性 质 ， 以 便于 估计 的 相关 系数 与 理论 相关 系数 的 比较 . 

MEXA, n 是 可 能 的 因 变 量 的 二 次 函数 的 比率 ， 显 然 的 样本 性 质 不 容易 得 到 .即便 
是 r; 的 期 望 值 也 很 难 确定 一 一 回想 一 下 ， 比 率 的 期 望 值 并 不 等 于 各 自 期 望 值 的 比率 ， 我 们 将 
满足 于 接受 一 个 一 般 的 大 样本 结论 并 且 考 虑 它 在 特例 中 的 应 用 .Bartlett(1946) 完成 了 最 初 的 
工作 . 我们 采纳 Anderson(1971) 给 出 的 更 一 般 的 结论 . 关于 这 些 结论 最 近 的 讨论 网 Shum- 
way 和 Stoffer(2006, 519 H). 

假设 


Y= pT Dve 
其 中 e 独立 同 分 布 并 具有 零 均值 和 有 限 非 零 同方 差 ， 进 一 步 假设 
> 11< =， Dig < ~ 


(任意 平稳 ARMA 模型 都 满足 这 一 假设 . ) 
那么 对 于 任意 固定 的 m， 当 nn 趋 于 无 穷 时 ， 联 合 分 布 
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Vm(ri — pi) ,nlr, 一 pr) "alien ,mr — pa 
BEHEA 0. WER ca PHBA cy 的 联合 正 态 分 布 ， 其 中 
fy = p> (Piti ary + Pii Piti — Pippi — 2ejorperi + pipip) Ch. 1.22 
4 n 充分 大 时 ， 我 们 将 认为 r 近似 服从 均值 为 pt， 方差 为 n/n WESA. Ih, Corr, rj) 
Crj | V ChkC jj « 注意 到 7 的 近似 方差 与 样本 的 大 小 成 反比 ， 但 是 当 ” 较 大 时 ，Corr(m， r;) 近似 为 
常数 . 


因为 在 当前 一 般 表达 式 下 ， 方 程 (6. 1. 2) RERE, 我 们 将 考虑 一 些 重要 的 特例 和 简化 
ER. 首先 假设 (Y) EARE. 那么 方程 (6. 1. 2) 将 大 大 简化 ， 我 们 得 到 


Var(r) = 一， Corr(r,,7;) ~ 0, k#Æj (6.1. 3) 


接 下 来 假设 {Y,) 由 ARCO) 过 程 产 生 ， 当 &>0 时 ，p 二 办 ， 那 么 经 过 大 量 的 代数 运算 及 
等 比 级 数 求 和 ， 由 方程 (6.1.2), 4 i=; 时 得 到 


w AIr atad a 
Var(r,) ~ nl TEF 2 好 | (6. 1. 4) 
特别 地 ， 
Var(n) ~ 1 一 二 (6. 1. 5) 


注意 $ 越 接近 土 1， 我 们 对 wm SA 的 估计 越 精确 . 
对 于 较 大 的 滞后 ， 方 程 (6.1.4 PERSP 的 项 可 以 忽略 不 计 ， 我 们 得 到 


brie 
Var(r) ~ {Tg | 对 较 大 的 (6. 1. 6) 


注意 ， 在 这 里 ， 与 方程 (6. 1. 5) 相反 ，#$ 接近 士 1 意味 着 n 有 大 的 方差 ， 因 此 对 于 大 的 & 值 ， 
我 们 不 能 期 望 像 较 小 时 用 o=% 那样 得 到 o. 的 近似 准确 的 估计 量 os 一 光一 0. 
对 ARC) 模型 ,方程 (6. 1.2) 也 可 以 被 简化 〈 经 过 大 量 的 代数 变换 ) ， 对 一 般 的 0 一 ;一 7 ， 有 


j-i__ jt 2 
= 二 GG—i$ G tip (6.1.7) 


P TAE ee 
Corr(n fo) se 2 1+ 2 — 3¢° : (6 i. 8) 


基于 方程 (6.1.4) 到 方程 (6.1.8), AK 6-1 给 出 了 ARO) 模型 在 几 个 滞后 和 多 值 下 的 
近似 标准 差 与 相关 系数 . 


Cy 


特别 地 ， 我 们 得 到 


图 表 6-1 AR{1) 模型 选 定 的 r 的 大 样本 结果 


$ „JVartr,) N/Var(r,) Corr(r,,r:) MVar(rio) 
土 0.9 0.44/./n 0.807//n + 0.97 2.44//n 
+ 0.7 0.71//n 1.12//n + 0.89 1.70//n 
+04 0.92/J/n LILA + 0.66 1.18//n 


+ 0.2 0.98//n 1.04 //n + 0.38 1.04 //n 
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对 MAC), 方程 (6.1.2) 可 简化 如 下 : 
cu = 1—30 +4» cu = 1+ 2p1,k > 1 (6.1.9) 
进一步 ， 

Ciz? = 2al — pi) (6. L 10) 
基于 这 些 表 达 式 ， 图 表 6-2 i TEILA EN ETF, WA A HR RA KAA ER E E AA 
KAR. 再 次 注意 ， 样 本 自 相 关系 数 可 能 高 度 相关 ， 并 且 &>1 时 六 的 标准 差 大 于 & 王 1 时 的 
标准 差 . 

图 表 6-2 MA(1) 模型 选 定 的 r 的 大 样本 结果 
0 ~ Var(r,) ~ Var(n\).k>1 Cor(r) rs) 


+09 0.71//n 1.22//n + 0.86 
+ 0.7 0.73/J/n 1.20//n +0.84 
土 0.5 0.79/J/n 1.15//n 0.74 
+0.4 0.89//n 1.11 Ar 70.53 


对 于 一 般 MA(g) WH, 4 i=j=k ht, AH (6.1.2) 化 简 成 
cu =1+2>) 0p, k>q 
j=) 
因此 ， 
1 q 
Var(r, == [1 +2206 | Rog (6. 1. 11) 


j=l 


对 于 观测 时 间 序 列 ， 开 方 后 ， 我 们 可 以 用 > 代替 o， 对 大 的 滞后 ， 得 到 r 的 估计 的 标准 
BH, Mr, 的 标准 误差 . 对 时 间 序 列 是 MA(q) 的 假设 的 验证 可 以 通过 把 7 与 正 负 2 倍 标准 误 
差 相 比 来 完成 。 当 且 仅 当 ~ 落 在 这 个 范围 外 拒绝 零 假设 一般 地 ， 我 们 并 不 期 望 样本 日 相关 
函数 能 够 在 细节 上 与 真实 的 自 相 关 函 数 吻 合 ， 因此， 如 果 在 六 中 看 到 在 相应 的 os 中 不 存在 的 
波动 或 “趋势 ”， 我 们 不 应 感到 惊讶 . 


6.2 偏 自 相 关 函 数 和 扩展 的 自 相 关 函 数 


对 于 MAQ) 模型 ， 当 滞后 超过 g 时 ， 自 相关 函数 为 0， 因 此， 样本 自 相关 函数 是 MA 过 
程 阶 数 的 一 个 良好 的 指示 器 . 但 是 ，AR(p〉 模 型 的 自 相关 函数 在 一 定 滞后 之 后 不 会 变 为 0， 
它们 是 逐渐 衰减 而 不 是 突然 截断 ， 因 此 ， 需 要 一 个 不 同 的 函数 来 确定 自 回 归 模 型 的 阶 数 . 这样 
的 函数 被 定义 为 消除 中 间 介 入 变量 Y,-1 s Y,- 23Y -Yi 的 影响 后 是 和 Y MAAK A RL A 
数 ， 我 们 称 这 个 系数 为 上 阶 滞后 偏 自 相 关系 数 ， 记 为 由， He 之 所 以 具有 看 似 多 余 的 双 写 下 
标 ， 其 原因 在 本 节 后 面 将 会 显而易见 . ) 

我 们 可 以 用 几 种 方法 使 这 个 定义 更 加 精确 .如 果 Y) 是正 态 分 布 的 时 间 序 列 ， 则 令 

du = Corr ly, oY | Yea Yn 0 °** sai) (6. 2.1) 
Bp pu 是 二 元 分 布 Y, 和 Y, 的 以 Yin 9 Vina 9 ls +1 为 条 件 的 相关 系数 . 
另 一 种 方法 ， 不 基于 正 态 分 布 ， 可 以 用 以 下 的 方法 推出 ， 考虑 用 中 间 介 入 变量 YoY- 
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Yi 的 线性 图 数 对 Y, BEAT AM, HR. AY HeY Hte Y n HP PHBREE 
预测 均 方 误差 最 小 ， 如果 假 设 8 什 已 经 选 定 ， 那 么 沿 时 间 轴 向 后 考虑 ， 从 平稳 性 可 以 知道 基于 
相同 的 fede oY ati AT Ya 的 最 优 预 测 是 BY -e+ fied nts HtA Yo. k Br H Ja 
偏 自 相 关 函 数 被 定义 为 预测 误差 之 间 的 相关 系数 ， 即 
$a = Corr(Y, — mY mı — BY -2 — H — Bei Yes T 
Y — A Y — BY a — ae ad ; (6. 2. 2) 
(对 于 正 态 分 布 的 时 间 序 列 ， 两 种 定义 是 一 致 的 . ) 通常 ， 我 们 取 四: = 1. 
举 个 例子 ， 我 们 计算 on. MRF ER, Y 只 基于 Y,-1 的 最 优 线性 观测 为 oY. 因此 ， 
根据 方程 (6. 2. 2)， 我 们 通过 计算 下 式 可 以 得 到 o: 
Cov(Y, — pi Yes TES: — MY) = Yo Coz — pi — pi + pi) = yo (pz — pi) 
因为 
Var(Y, — pY) = Var(Y ， — a Yi) = y (1 + pi 一 2p) = ¥, (1 — p) 
对 于 任意 平稳 过 程 ， 二 阶 滞后 偏 自 相关 系数 可 以 表示 为 
p22 = ex — pi | (6. 2. 3) 
1 — ø 
现在 考虑 ARO) 模型 ， 前 已 述 及 ，p = 上 ， 所 以 


ld _ 
$n = i—¢ = 0 


我 们 将 看 到 对 AR(1) 的 情况 ， 对 于 所 有 RSI, fa 二 0。 因 此， 对 滞后 1， 即 AR(1) 过 程 的 阶 
数 ， 偏 自 相 关系 数 非 零 ， 但 是 对 于 所 有 大 于 1 的 沾 后 ， 偏 自 相关 系数 都 为 零 . 我 们 将 证 明 对 
AR(p) 模型 ， 这 是 一 般 的 情况 . 有 时 ， 我 们 称 AR(p) 过 程 的 偏 自 相 关 星 数 在 滞后 超过 过 程 
的 阶 数 时 截 尾 ， 

考虑 一 般 的 AR(p) 情况 . 第 9 MU, 4k>p Bt, Y, 基于 了 -9 了 Yo 
一 t+1 的 线性 函数 的 最 优 线 性 预测 是 $ Y,- FAY, “+e THY, pe 同样 » Vows 的 最 优 线性 预测 
也 是 Yrren Y, a atl 的 某 个 线性 函数 ， 记 为 ACY ,i Ya per’ oP eri): 因为 
Er 独立 于 Ye) Secret ate” Yi- 所 以 两 个 预测 误差 的 协 方差 是 

Cov(Y, — A Y -1 — Y e — tt — bp Yep Yee — ACY Re Yee tte Ped) 
= Cove, Yeu — ACY en Y eot Ye) 


= 0 
因此 ， 对 于 AR) 模型 ， 我 们 确立 了 关键 的 事实 : 
dy =0, k>p (6. 2. 4) 
对 MAC) 模型 ， 从 方程 (6. 2. 3) 易 得 
$a = 二 一 (6.2.5) 
进而 ， 对 MA(1) 的 情况 ， 可 以 证 明 b 
Pa 一 k>1 (6. 2. 6) 


注意 ，MA(1) 模型 的 偏 自 相 关系 数 从 不 等 于 零 ， 但 是 随 着 滞后 的 增加 ， 会 指数 级 地 快速 衰减 
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至 零 一 一 与 AR(1) 过 程 的 自 相关 函数 非常 类 似 ， 更 一 般 地 ， 可 以 证 明 MACq) 模型 的 偏 自 相 
关 函 数 的 表现 与 ARQ) 模型 的 自 相关 项 数 非常 相似 
对 具有 自 相关 函数 ps 的 任意 平稳 过 程 ， 求 偏 自 相关 函数 的 一 般 方法 如 下 〈 例 如， 参阅 
Anderson 1971, 187—188 页 )、 对 于 给 定 的 滞后 &， 可 以 证 明 fu WE Yule-Walker PH GK 
程 首次 出 现在 第 4 章 ): 
p; 一 gp 十 加 pi 十 gp 十 … 十 各 pi- 了 一 1,2,.",k (6.2.1) 
更 清楚 地 ， 我 们 可 以 把 这 个 线性 方程 记 为 
$a + pi Paz + pz Pis i 十 pe Pu = pi 
pi Par h $a + pi Pra E 十 piz Pu => Ds (6. 2. 8) 
pi-i Pri 十 Pi- Peo + pPr-a Pra s E 3 $u = pk 
此 处 ， 我 们 把 Pl ?Pz ”OO 看 做 是 给 定 的 ， 希望 解 出 Par s Paz ss Pi 《除了 pu 去掉 所 有 其 他 的 ). 
对 于 任意 平稳 过 程 ， 这 些 公式 可 以 解 出 加， 但是， 如 果 这 个 过 程 实际 上 是 AR(z) ， 因 为 
对 k= 二 p， 方 程 (6. 2. 8) 恰好 是 Yule-Walker HH, BA AR) 模型 满足 该 方程 ， 我们 一 定 
有 fa =f. 此外， 我 们 已 经 看 到 通过 另外 一 种 推导 ， 对 p 有 pw —0. Ast, ta Be HK 
有 效 地 展示 了 自 回归 过 程 的 正确 阶 数 p 是 #$ 变 成 0 前 最 大 的 滞后 k. 
样本 偏 自 相 关 郴 数 
对 于 观测 时 间 序 列 ， 我 们 需要 能 够 估计 不 同 滞 后 下 的 偏 自 相 关 函 数 ， 根 据 方程 〈6. 2. 8) 
给 出 的 关系 式 ， 一 个 显而易见 的 方法 是 用 样本 自 相 关系 数 〈 即 相应 的 ~ 值 ) 来 估计 p， 然 后 对 
& 一 1,2,3,… 求 解 线性 方程 ， 得 到 如 的 估计 ， 我 们 称 估计 的 函数 为 样本 偏 自 相关 函数 (样本 
PACF) 并 记 为 p. 
Levinson(1947) 和 Durbin(1960) 给 出 了 求解 方程 (6. 2. 8) 的 有 效 方法 ， 适 用 于 求 理论 
偏 自 相 关系 数 和 求 样本 偏 自 相关 系数 .他 们 独立 地 证 明了 方程 (6. 2.8) 可 以 用 如 下 方式 递归 
求解 : 


k=l 
~ >, Piip 
= 


k-i f 
] 一 >, Pi—1. 503 
j=1 


Pep = 66. 2. 9) 


其 中 ， 
内, — gl, — bur Pis ey» j= 1,2,°*,k—1 
例如 ， 以 dy = pi 开始 ， 我 们 得 到 


bo. = oz — fup _ ez — pA 
1— $i pr 1— pi 


如 前 ， 我 们 为 了 下 一 步 的 计算 ， A pn 二 办 1 一 各 :和 1， 则 


$ 03 — $2102 一 $2201 
53 $2) pı = p22 02 


因而 ， 我 们 可 以 数值 计算 想 要 的 任意 的 bu fE. 按照 上 面 的 介绍 ， 这 些 递归 公式 给 出 了 理 
论 仿 自 相关 系数 ， 但是， 用 7 代替 p 就 可 以 得 到 估计 的 或 样本 偏 自 相关 系数 . 


82 HOF 


为 了 评估 样本 偏 自 相关 系数 可 能 的 大 小 ，Quenoulle(1949) 证 明了 在 AR(p) 模型 是 正确 的 
BREF. RAF p 时 样本 偏 自 相 关 函 数 近似 服从 均值 为 零 、 方 差 为 1/n 的 正 态 分 布 ， 因 此 ， 当 
kp 时， 我 们 可 以 用 土 2/Vn 作 为 $% 的 临界 极限 值 来 检验 AR) 模型 是 正确 的 零 假 设 . 

混合 模型 和 扩展 的 自 相 关 函 数 

图 表 6-3 总 结 了 在 模型 识别 中 有 用 的 自 相 关 和 偏 自 相关 画 数 的 特征 . 

图 表 6-3 ARMA 模型 ACF 和 PACF 的 一 般 特 征 


AR(p) MA(q) ARMA(p, g), p>0, q>0 
ACF 拖 尾 洁 后 g MERE Hi E 
PACF HR PMR 拖 尾 He 


扩展 的 自 相 关 函 数 

样本 ACF 和 PACF 为 识别 纯 AR) 或 MA(g) 模型 提供 了 有 效 的 工具 但是， 对 混合 AR- 
MA 模型 来 说 ， 它 的 理论 ACF 和 PACF 有 着 无 限 多 的 非 零 值 ， 使 得 根据 样本 ACF 和 PACF 来 识 
别 混合 模型 非常 困难 . 为 了 便于 确定 ARMA 模型 的 阶 数 ， 一 些 绘图 工具 被 提出 ， 例 如 ， 其 中 包 
括 边 角 解 法 (Becuin 等 ，1980)、 扩 展 的 自 相 关 法 (CEACF) (Tsay 和 Tiao，1984)、 最 小 典型 相关 
法 (SCAN)(Tsay 和 Tiao，1985)， 我 们 将 概要 地 介绍 EACF 法 ， 因 为 根据 W. S. Chan(1999) 用 
模拟 法 所 做 的 比较 研究 ，EACF 法 对 于 适度 大 的 样本 容量 似乎 具有 优良 的 样本 性 质 ， 

EACF 法 用 到 了 这 样 一 个 事实 ， 如 果 混 合 ARMA 模型 的 AR 部 分 是 已 知 的 ， 则 从 观测 时 
间 序 列 中 “让 出 ” 自 回归 部 分 将 得 到 一 个 纯 MA 过 程 ， 该 过 程 的 ACF 具有 截 尾 的 特征 . 6 
归 系 数 可 以 通过 有 限 次 的 一 系列 回归 来 估计 对 真实 模型 是 ARMA(1，1) 模型 的 情况 ， 我 们 
来 演示 一 下 这 个 过 程 ， 

Y, = $Y, +e, — 0em 

在 这 种 情况 下 ， Y, 对 Y,_1 的 简单 线性 回归 得 到 $$ 的 不 一 致 估计 量 ， 即 使 使 用 无 穷 多 的 数据 也 是 
如 此 .实际 上 ， 理 论 回归 系数 等 于 o =(¢-O0—-8)/A—-290+6), MARS 但 是 ， 该 回归 的 残 
差 确实 包含 了 误差 过 程 (e) 的 信息 ， 第 二 次 回归 是 Y 对 Y_1 和 第 一 次 回归 残 差 的 一 次 滞后 进行 的 
多 元 回归 . 第 二 次 回归 中 Y._1 的 系数 用 RR, EHE p WB. EXW, =Y, — pY, X 
过 程 近似 是 一 个 MAC) HE. X ARMAC, 2) 模型 ， 第 三 次 回归 是 对 自身 的 1 阶 滞后 、 第 二 
次 回归 残 差 的 1 阶 滞后 项 和 第 一 次 回归 残 差 的 2 阶 滞后 进行 的 回归 ， 得 到 的 YW AR oH 
hit. 类似 地 ， 通 过 一 系列 的 g 次 回归 可 以 一 致 地 估计 出 ARMA(p，g) 模型 的 AR 系数 . 

由 于 AR 和 MA 的 阶 数 都 是 未 知 的 ， 因 此 需要 一 个 迭代 过 程 . + 

Wray = Y, — $Y Ys (6. 2. 10) 

为 AR 系数 定义 的 自 回 归 残 差 ， 系 数 是 假设 AR 的 阶 数 为 上 ，MA 的 阶 数 为 了 了 时， 和 迭代 估计 得 
AA. 多 ,的 样本 自 相 关系 数 被 称 为 扩展 的 样本 自 相 关系 数 . 5 k5p Hj hf, (Way) 近 
Ws MAQ) 模型 ， 所 以 滞后 g 十 1 阶 或 更 高 阶 理论 自 相 关系 数 等 于 零 . Shope, 会 出 现 过 
度 拟 合 问 题 ， 这 将 使 W 过 程 的 MA 阶 数 增 加 ， 增 加 的 大 小 是 一 p 和 ;一 g 中 的 最 小 值 . Tsay 
和 Tiao(1984) 建议 将 样本 的 EACF 信息 汇总 在 一 张 表 中 ， 第 直行 和 第 7 ITRANS XE 
示 ， 如 果 Wa i+] 阶 滞后 样本 相关 系数 显著 不 为 零 ( 即 相关 程度 大 于 1. 96/ wz 一 7 一 上 ， 因 
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为 如 果 W 是 近似 MAG) HE, WHA RA RAR IRMA NCO, 1/(n—k—-j))), Bil 
用 0 表示. 在 这 样 一 张 表 中 ，ARMA(p，g) 过 程 在 理论 上 有 一 个 由 零 构成 的 三 角 模 式 ， 其 左 
上 和 角 对 应 着 ARMA 模型 的 阶 数 . 图 表 6-4 显示 了 ARMA(1，1) 模型 模式 的 示意 图 ， 零 三 角 
的 左上 角 用 0" 表示， 处 于 p= 二 1 行 和 9g 二 1 列 一 一 表明 是 ARMA(1，1) 模型 . 

图 表 6-4 ARMA(1，1) 模型 的 理论 扩展 ACF (EACF) 


AR/MA | 0 1 2 3 4 5 6 7 8 9 0 nun RR B 
0 x x x x x x x x z x x x x x 
1 x O° 0 0 0 0 0 0 0 0 0 0 0 0 
2 x x | 0 0 0 0 0 Q 0) 0 0 0 0 0 
3 x x x 0 0 0 0 0 0 0 0 0 0 0 
4 x x x x 0 0 0 0 0 0 0 0 0 0 
5 x x x x x 0 0 0 0 0 0 0 0 0 
6 x x x X x x 0 ü 0 0 0 0 0 0 
7 x x x x x xX k 0 0 0 0 0 0 0 


当然 ， 样 本 EACF 从 来 不 可 能 像 这 样 清 清楚 楚 . 图 表 6-4 的 示意 图 包含 了 8X14 一 112 个 
不 同 的 估计 的 相关 系数 ， 某 些 系 数 可 能 由 于 偶然 因素 在 统计 上 显著 不 为 零 〈 参 阅 图 表 6-17 的 
例子 )， 我 们 将 在 接 下 来 的 两 节 和 本 书 的 剩余 部 分 阐述 EACF 的 使 用 . 


6. 3 ”对 一 些 模拟 的 时 间 序 列 数据 的 识别 
为 了 阐述 6. 1 节 和 6.2 节 的 理论 ,我们 考虑 一 些 模 拟 的 时 间 序 列 的 样本 自 相关 函数 和 样本 
偏 相关 函数 . 
图 表 6-5 展示 了 模拟 的 时 间 序列 滞后 到 20 阶 的 样本 自 相 关 函 数 图 ， 该 序列 最 早 在 图 表 4 -5 中 出 
现 ， 这 个 长 为 120 的 序列 是 由 0=0. 9 的 MAOD 模型 产生 的 、 从 图 表 4-1 可 知 ，1 阶 滞后 的 理论 自 相 
关系 数 为 一 0, 4972， 图 中 估计 的 或 样本 的 1 阶 滞后 的 自 相关 系数 为 一 0. 474， 使 用 图 表 6-2， 佑 计 的 
近似 标准 误差 为 0.71/Yn 二 0.71/ V1i20==0.065， 因 此 ， 估 计 值 落 在 真 值 的 2 MERZ. 
图 表 6-5 9=0.9 的 MA(1) 过 程 的 样本 自 相 关 函 数 


> data(mal.1.s) 
> win.graph (width=4.875,height=3,pointsize=8) 
> acf(mal.l.s,xaxp=c(0,20,10)) 


84 第 6 章 


图 表 6-5 中 的 水 平 虚线 分 别 位 于 士 2/Yn 二 土 0. 1826 处 ， 旨 在 给 出 检验 自 相 关系 数 是 否 显 著 


为 不 等 于 零 的 临界 值 ， 这 些 临 界 值 是 基于 白 噪声 过 程 中 的 近似 大 样本 标准 误差 ， 即 1/Yn， 注 
意 到 样本 ACF 值 在 滞后 1、5 和 14 阶 处 超出 这 些 粗 略 的 临界 值 . 当然 ， 真 实 自 相 关系 数 在 5 
阶 和 14 阶 滞后 处 均 为 零 . 

图 表 6-6 展示 了 相同 的 样本 ACF， 但 是 临界 边界 不 同 ， 边 界 是 方程 (6.1.11) 给 出 的 更 复 
杂 的 标准 误差 的 正 负 2 倍 .使 用 方程 (6. 1. 11) 时 ， 我 们 用 -代替 p 值 ， 令 q 依次 等 于 1,2,3,… 
然后 开 方 得 到 这 些 标准 误差 . 


图 表 6-6 MA(1) 过 程 具 有 另外 一 种 边界 的 样本 ACF 


2 4 6 8 10 12 14 6 18 20 
HI 


> acf (mal.1.s,ci.type='ma',xaxp=c(0,20,10)) 


现在 样本 ACF 值 在 14 阶 滞后 处 不 再 显著 ， 在 5 阶 滞后 处 勉强 显著 .1 阶 滞后 自 相 关系 数 
仍然 非常 显著 ， 两 幅 图 所 给 出 的 信息 综合 在 一 起 使 我 们 考虑 为 这 个 序列 拟 合 MAC) 模型 ， 记 
住 此 时 的 模型 是 实验 性 的 ， 当 进行 模型 诊断 时 ， 我 们 当然 会 考虑 其 他 “接近 ”的 模型 . 

”第 二 个 例子 ， 图 表 6-7 展示 了 图 表 4-2 给 出 的 序列 的 样本 ACF， 该 序列 是 由 O=—0.9 的 
MA(1) 模型 产生 的 ， 基 于 非常 近似 标准 误差 的 临界 值 同样 显示 此 序列 为 一 个 MA(1) 模型 ， 


图 表 6-7 6= 一 0.9 的 MA(1) 过 程 的 样本 自 相关 函数 


2 4 6 8 10 12 14 16 18 20 
滞后 


> data(mal.2.s); acf(mal.2.s,xaxp=c(0,20,10)) 


第 三 个 例子 ， 我 们 使 用 图 表 4-8 显示 的 数据 ， 这 些 数 据 是 由 9 二 1，09, 二 一 0.6 的 MA(2) 
模型 模拟 而 成 的 ， 当 我 们 使 用 简单 标准 误差 为 临界 值 时 ， 样 本 ACF 在 1, 2, 5, 6, 7 和 14 阶 
Ur a Ab fe 
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图 表 6-8 6,=1, 62=—0.6 的 MA(2) 过 程 的 样本 ACF 


2 4 6 8 


I2 14 16 18 20 


10 
He 


> data(ma2.s); acf(ma2.s,xaxp=c(0,20,10)) 


图 表 6-9 展示 了 具有 更 复杂 的 标准 误差 边界 的 样本 ACF. 此 时 ，2 阶 滞后 ACE 不 再 显著 ， 
似乎 可 以 应 用 MAC) 模型 ， 但 是 我 们 必须 等 待 ， 直 到 按照 建 模 过 程 进一步 研究 发 现 MA(2) 模 
型 (正确 的 那个 ) 是 最 适合 这 些 数据 的 模型 . 


图 表 6-9 MA(2) 过 程 具有 另外 一 种 边界 的 样本 ACF 


— = a a 


2 4 6 8 10 #12 14 16 18 20 
滞后 


> acf(ma2.s,ci.type='ma',xaxp=c(0,20,10)) 


这 些 技术 对 自 回归 模型 效果 如 何 ? 图 表 6-10 给 出 了 我 们 在 图 表 4-13 中 看 到 的 模拟 的 
AR(1) 过 程 的 样本 ACF. 在 1，2，3 阶 滞后 处 的 正 样本 ACF 值 反映 了 我 们 之 前 在 图 表 4-14、 
图 表 4-15 和 图 表 4-16 中 见 到 的 滞后 关系 的 强度 ， 但 是 ， 注 意 样 本 ACK 值 是 线性 递减 而 不 是 像 
理论 预示 的 那样 按 指数 阶 递减 ,同样 与 理论 不 同 的 是 ， 样 本 ACF 值 在 10 WH RARE, 
并 且 在 之 后 的 许多 阶 滞后 处 保持 了 负 值 . 


图 表 6-10 ¢=0.9 AY AR(1) 过 程 的 样本 ACF 


=- = ir = 


> datalarl.s); acf(arl.s,xaxp=c(0,20,10)) 
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图 表 6-11 中 显示 的 样本 偏 自 相关 函数 (PACF) 给 出 了 一 个 关于 生成 模型 本 质 的 更 清晰 的 
PAR. 基于 这 幅 图 形 ， 对 这 个 时 间 序 列 ， 我 们 当然 会 接受 ARC) 模型 . 
图 表 6-11 $=0.9 的 AR(1) 过 程 的 样本 偏 ACF 


> pacf (arl.s,xaxp=c(0,20,10) ) 


图 表 6-12 展示 了 AR(2) 时 间 序 列 的 样本 ACF. 该 序列 的 时 间 序 列 图 显示 在 图 表 4- 19 
中 ， 样 本 ACF 确实 看 起 来 有 点 像 方程 (4.3.17) 和 图 表 4-18 提出 的 阻尼 波 . 但 是 ， 样 本 
ACF 没有 像 理论 预示 的 那样 衰减 得 那么 快 . 


图 表 6-12 ¢:=1.5, $: =—0.75 6 AR(2) 过 程 的 样本 ACF 


0.6 


> acf (ar2.s,xaxp=c(0,20,10)) 


图 表 6-13 中 的 样本 PACF 给 出 如 下 有 力 的 上 暗示 : 应 为 数据 序列 建立 AR(2) RB. 当然， 
我 们 在 模型 诊断 过 程 中 ， 在 9 阶 滞后 处 看 起 来 显著 的 样本 PACF 需要 进一步 研究 . 


图 表 6-13 ¢,=1.5, = 一 0.75 的 AR(2) 过 程 的 样本 PACF 


> pacf (ar2.s,xaxp=c(0,20,10)) 
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最 后 一 个 例子 ， 我 们 模拟 g 一 0.6，b= 一 0.3 的 混合 ARMA(l1，1) 模型 的 100 个 数据 ， 图 
表 6-14、 图 表 6-15 和 图 表 6-16 分 别 展 示 了 时 间 序 列 图 、 样 本 ACF 和 样本 PACF. 这 些 图 看 起 
来 表明 我 们 应 该 设 定 一 个 ARO) 模型 . 


图 表 6-14 模拟 的 四 =0.6， 8= 一 0.3 的 ARMA(1，1) 序列 


时 间 


> data(armall.s) 
> plot (armall.s, type='o',ylab=expression (Y{t]}) 


Ő 


图 表 6-15 ”模拟 的 ARMA(1, 1) 序列 的 样本 ACF 


> acf (armail.s,xaxp=c(0,20,10)) 


图 表 6-16 ”模拟 的 ARMA(1, 1) 序列 的 样本 PACF 
ae re A a i a DE me 


PACF 


> pacf (armail.s,xaxp=c(0,20,10)) 


但 是 ， 图 表 6-17 中 样本 EACF 中 的 零 三 角 区 域 非常 清楚 地 显示 出 =l, p= 1 或 2 WIR 
模型 更 合适 .在 6. 6 节 当 我 们 识别 一 些 真实 的 序列 时 ， 将 进一步 前 述 EACF 的 应 用 ， 
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图 表 6-17 模拟 的 ARMA(1, 1) 序列 的 样本 EACF 
6 9 
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> eacf{armall. 


6.4 非 平稳 性 


第 5 章 中 指出 ， 许 多 序列 显示 出 可 以 由 ARIMA 模型 解释 的 非 平稳 性 非 平 稳 性 在 序列 的 
时 间 序 列 图 中 通常 比较 明显 ， 这 里 建议 复习 一 下 图 表 5-1、 图 表 5-5 和 图 表 5-8. 

非 平稳 序列 计算 出 的 样本 ACF 通常 也 能 表明 非 平稳 性 、， 样 本 自 相 关 函 数 的 定义 隐 含 着 平 
稳 性 的 假定 ， 例 如 ， 我 们 使 用 相对 总 体 均 值 的 偏差 程度 的 滞后 乘积 ， 分 母 假 设 方差 随时 间 是 党 
数 ， 因此， 对 非 平稳 过 程 来 说 ， 我 们 根本 不 清楚 样本 ACF 估计 的 是 什么 . 但是， 对 非 平 稳 序 
列 来 说 ， 样 本 ACF 通常 不 会 随 着 滞后 的 增加 而 迅速 衰减 . 这 是 由 于 非 平稳 序列 倾向 于 缓慢 地 
移动 ， 或 者 向 上 ， 或 者 向 下 ， 具 有 明显 的 “趋势 "即使 对 于 很 小 的 滞后 ，r: 的 值 不 一 定 很 大 ， 
不 过 通常 它们 是 很 大 的 . 

考虑 图 表 5-1 中 显示 的 石油 价格 时 间 序 列 ， 图 表 6-18 展示 了 这 些 数据 对 数 的 样本 ACF. 
所 有 显示 出 的 值 都 显著 不 为 零 ， 唯 一 的 模式 可 能 是 随 着 滞后 项 的 增加 ， 样 本 ACF 线性 递减 . 
样本 PACF fÈ 〈 未 展示 出 ) 也 是 不 确定 的 . 


图 表 6-18 ”石油 价格 时 间 序 列 样本 ACF 


2 4 6 B 10 12 1 18 20 2 
滞后 


> data(oil.price) 
> acf(as.vector(oil.price) ,xaxp=c(0,24,12) ) 


对 石油 价格 对 数 差 分 序列 计算 出 的 样本 ACF 显示 在 图 表 6-19 中 .现在 模式 较 清 晰 地 出 现 
了 一 一 差分 后 ， 一 阶 滑动 平均 模型 看 起 来 很 适合 ， 因 此 ， 适 合 原始 石油 价格 序列 的 模型 是非 平 
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fa IMA(1, 1) 模型 . (现在 我 们 忽略 15、16 和 20 阶 沾 后 处 的 ACF 的 “显著 性 ”. ) 
图 表 6-19 石油 价格 序列 对 数 差分 的 样本 ACF 


O 
< 0.0 
A ee 
2 4 6 8 10 12 14 16 18 20 22 
滞后 
> acf (diff (as.vector(log({oil.price))),xaxp=c(0,24,12)) 


如 果 序 列 的 一 次 差分 和 样本 ACF 不 支持 平稳 的 ARMA 模型 ， 那 么 我 们 需要 再 次 差分 并 计 
算 样本 ACF A PACF 值 来 检查 是 否 符 合 平稳 ARMA 过 程 的 特征 ， 通常 ， 一 次 或 最 多 两 次 差 
分 ， 可 能 伴随 着 对 数 或 其 他 形式 的 转换 ， 将 完成 平稳 性 的 化 简 . Wichern(1973)、Roy(1977) 
和 Hasza(1980) 给 出 了 用 非 平稳 数据 计算 的 样本 ACF 的 其 他 性 质 ， 也 可 以 参阅 Box, Jenkins 
和 Reinsel(1994，218 页 ). 

过 度 差 分 

从 习题 2.6， 我 们 知道 任意 平稳 时 间 序 列 的 差分 仍 是 平稳 的 . 但 是 ,， 过 度 差 分 会 给 序列 带 
来 不 必要 的 相关 性 并 使 建 模 过 程 复杂 化 . 

例如 ， 假 设 观测 序列 (Y) 实际 上 是 随机 游 动 ， 因 此 ， 一 次 差分 后 将 得 到 一 个 非常 简单 的 
白 品 声 模型 : 

VY,=Y—Y =e, 
但 是 ， 如 果 再 差分 一 次 ( 即 过 度 差分 )， 我 们 得 到 
VY, = e, — en 
这 是 一 个 9=1 的 MA(1) 模型 .在 这 种 情况 下 ， 如 果 差 分 两 次 ， 我 们 就 必须 估计 未 知 的 0 值 ， 
这 是 没 必 要 的 . 这 里 识别 为 IMA(2，1) 模型 是 不 合适 的 ， 随 机 游 动 模型 (也 可 以 认为 是 9 二 0 
的 IMA(1，1) 模型 ) 是 正确 的 模型 8， 过度 差分 还 会 产生 不 可 逆 的 模型 一 一 参阅 4.5 7°. % 
我 们 尝试 估计 参数 时 ， 不 可 首 模型 还 会 产生 严重 问题 一 一 参阅 第 7 章 . 

为 了 说 明 过 度 差分 问题 ， 考 虑 图 表 2-1 显示 的 随机 游 动 ， 差 分 一 次 得 到 白 噪声 一 一 一 个 非常 
简单 的 模型 ， 如 果 我 们 错误 地 差分 两 次 〈 即 过 度 差分 ) 并 且 计 算 样本 ACF， 将 得 到 图 表 6-20 所 未 
的 图 形 ， 基 于 这 张 图 ， 我 们 很 可 能 对 原始 序列 至 少 识别 为 IMA(2，1) 模型 ， 然 后 估计 不 必要 
的 MA 参数 .我 们 还 需要 考虑 和 处 理 在 7 阶 滞后 处 显著 的 样本 ACF 值 . 


蝗 ” 随 机 游 动 模型 也 可 以 被 看 成 $=0 的 ARI(1，1) 模型 ,或 者 $1 的 非 平稳 ARO) MA. 
乌 ” 用 延迟 算 子 符号 ， 如 果 正 确 模型 是 %B)(1 一 B)Y, = 8(B)e, ， 过 度 差 分 得 到 ABO 一 B)?Y, = 0(B)(1 Be = 
9'(B)e, ， 其 中 8(B) = (1 一 BOB), BA., B=1 是 8(B) 的 “被 禁止 ”的 根 . 
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图 表 6-20 ”过 度 差分 随机 游 动 的 样本 ACF 


> data (rwalk) 
> acf (diff (rwalk,difference=2),ci.type='ma', xaxp=c(0,18,9)) 


相反 ， 图 表 6-21 展示 了 随机 游 动 序列 一 次 差分 后 的 样本 ACF 值 . 观察 这 幅 图 ， 我 们 很 可 
能 会 考虑 正确 的 模型 一 一 一 次 差分 看 起 来 非常 像 白 噪声 . 


图 表 6-21 正确 差分 的 随机 游 动 的 样本 ACF 


说 后 


> acf (diff (rwalk) ,ci.type='ma' ,xaxp=c(0,18,9)) 


为 了 避免 过 度 差分 ， 建 议 读 者 依次 仔细 查看 各 个 差分 并 且 牢 记 简 洁 性 原则 一 一 -模型 应 该 简 
洁 ， 但 也 不 要 失 之 草 率 . 
Dickey-Fuller 单位 根 检验 
样本 ACF 的 近似 线性 衰减 通常 被 认为 是 时 间 序 列 非 平稳 并 且 需 差分 的 征兆 ， 定量 分 析 数 
据 生 成 机 制 中 非 平稳 的 证 据 也 是 很 有 用 的 . 这 可 以 通过 假设 检验 来 完成 ， 考虑 模型 
Y, =aY¥.,t+X,, t= 1,2," 
Hr, (X) 是 平稳 过 程 。， 如 果 系 数 a 二 1，1{Y,} 过 程 非 平稳 ; 如果 |e| 二 1， 则 过 程 平 稳 . B 
” 设 {X,} 是 AR(k) 过 程 ，X, 一 轴 X,- Hee FOX, +e. 在 零 假设 为 a=1, X,=Y,—Y,-; F, 
令 a 二 a 一 1， 我 们 有 
bf dE = (a— DY, + A; 
一 QY， +$ Xe tee + hX a te, (6. 4. 1) 
= aY m +$ (Ym —Yr2) +" +A Yen — Ym) + 
Ht, EY, 为 差分 非 平稳 的 假设 下 ，a 二 0。 另 一 方面 ， 如 果 (Y) 是 平稳 的 ， 则 一 1 和 <1， 可 
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以 证 明 Y, 仍然 满足 一 个 与 上 式 类 似 的 方程 ， 但 是 具有 不 同 的 系数 .例如 a= 0g eg) ， 
(1—a) <0. SRE, (Y) 就 是 一 个 ARCA+)D 过 程 ， 它 的 AR 特征 方程 由 B(x) (1 一 gx)= 二 0 
给 出 ， 其 中 paS hrer PU, SRB AR 特征 多 项 式 有 一 个 单位 根 的 情 
况 ， 备 择 假 设 对 应 没有 单位 根 的 情况 . 因此， 对 差分 序列 的 检验 等 价 于 检验 CY.) 的 AR 特征 
多 项 式 是 否 存 在 单位 根 . 

由 上 面 的 分 析 可 知 ， 零 假设 a==1 (等 价 地 a 二 0) 可 以 通过 用 观测 时 间 序 列 的 一 次 差分 对 
观测 序列 的 一 阶 滞后 和 观测 序列 一 次 差分 的 所 有 天 阶 滞后 的 回归 来 检验 . 我 们 检验 系数 a 是 否 
为 0 一 一 零 假 设 是 该 过 程 为 差分 非 平稳 的 . 即 过 程 非 平稳 ， 但 差分 一 次 后 平稳 . 备 择 假 设 是 
a<0， 从 而 (Y 是 平稳 的 ， 增 强 的 Dickey-Fuller(ADF) 检验 统计 量 是 用 最 小 二 乘 回归 所 得 
估计 系数 a 的 上 统计 量 . 但 是 ， 在 零 假 设 下 ，ADF 检验 统计 量 并 不 近似 服从 t 分布 ， 在 有 单位 
根 的 零 假 设 下 ， 该 统计 量 服 从 某 种 非 标准 的 大 样本 分 布 . 幸运 的 是 ， 这 种 极限 分 布 的 百分比 点 
数 已 经 制 成 表 了 ， 参 阅 Fuller(1996). 

实践 中 ， 即 使 经 过 一 阶 差分 ， 过 程 可 能 也 不 是 一 个 有 限 阶 AR 过 程 . 但是， 可 以 用 某 个 
AR 过 程 充分 近似 ， 并 且 AR 阶 数 随 着 样本 量 的 增加 而 增加 ，Said 和 Dickey(1984) (也 可 以 参 
阅 Chang 和 Park(2002)) 证 明了 当 AR 阶 数 随 着 样本 量 的 增加 而 增加 时 ， 零 假设 下 ADF 检验 
与 序列 的 一 阶 差 分 是 有 限 阶 AR 过 程 的 情况 一 样 ， 具 有 相同 的 大 样本 分 布 . 通常 ，ADF 检验 
前 ， 近 似 的 AR 阶 数 可 以 基于 一 些 信息 准则 (比如 AIC 或 BIC) 来 估计 ， 有关 AIC 或 BIC 的 
更 多 内 容 参 阅 6.5 节 . 

某 些 情况 下 ， 过 程 可 能 是 趋势 非 平稳 的 ， 在 某 种 意义 上 指 它 具有 一 个 确定 性 趋势 ( 比 
如 ， 线 性 趋势 ) ， 否 则 是 平稳 的 ， 进行 单位 根 检验 就 是 为 了 区 分 差分 平稳 性 和 趋势 平稳 性 . 
可 以 通过 对 去 趋势 后 的 数据 进行 ADF 检验 来 实现 这 一 日 的 .等 价 地 ， 也 可 以 通过 用 一 阶 差 
分 对 定义 为 趋势 、 原 始 数据 的 一 阶 滞后 以 及 原始 数据 一 阶 善 分 后 的 所 有 滞后 这 些 协 变量 的 回 
归来 完成 ， 基 于 估计 的 原始 数据 一 阶 滞后 系数 的 上 统计 量 提 供 了 ADF 检验 统计 量 ， 这 个 统 
计量 服从 另 一 个 非 标 准 的 大 样本 零 分 布 ， 参 阅 Phillips 和 Xiao(1998) 所 做 的 关于 单位 根 检验 
的 综述 ， 

我 们 现在 用 图 表 2-1 显示 的 模拟 的 随机 游 动 序 列 来 阐述 ADF 检验 . 首先 ， 我 们 考虑 检验 
具有 单位 根 的 零 假设 对 时 间 序 列 是 具有 未 知 均值 的 平稳 序列 的 备 择 假 设 . 因此 ， 方 程 (6. 4. 1) 
定义 的 回归 方程 中 增加 一 个 截 距 项 ， 从 而 在 备 择 假 设 下 允许 有 可 能 的 非 零 均值 ，( 对 于 过 程 是 
具有 零 均 值 的 平稳 过 程 的 备 择 假设 来 说 ， 我 们 可 以 通过 运行 方程 (6. 4. 1) 定义 的 没有 增强 的 
回归 得 到 ADF 检验 统计 量 . ) 为 了 检验 的 进行 ， 我 们 必须 确定 上 值 8， 利 用 对 数据 的 一 阶 差分 
的 AIC， 我 们 得 到 =8， 在 这 种 情况 下 ，ADF 检验 统计 量 是 一 0. 601， 其 p 值 大 于 0. 19. 3 
一 方面 , 设 有 二 0 (真实 的 阶 数 ) 将 使 ADF 统计 量变 为 一 1. 738，p 值 仍 大 于 0.1%. A, R 
们 有 很 强 的 证 据 支 持 单位 根 假设 . 其次， 回想 一 下 ， 模 拟 的 随机 游 动 看 起 来 具有 一 个 线性 趋 
势 ， 因 此 ， 线 性 趋势 加 上 平稳 误差 形成 了 另 一 种 合理 的 备 择 假设 ， 与 单位 根 的 零 假设 相对 〈 老 


© RR 代码 :; ar (diff (rwalk)). 
© RR 代码 : library (urcet);ADF.test (rwalk,selectlags= list (mode= c(1,2,3,4,5,6,7,8),Pmax= 8),itesd= c(1,0,0)). 
© ADF.test (rwalk,selectlags= list (Pmax= 0), itad= c({1,0,0}). 
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分 非 平稳 )， 对 于 这 个 检验 ， 我 们 在 方程 (6. 4. 1) 定义 的 回归 中 既 包 括 了 截 距 项 ， 也 包括 时 间 
协 变 量 ， 令 上 一 8，ADF 检验 统计 量 等 于 一 2. 289，p 值 大 于 0.19 ， 即 我 们 不 能 拒绝 单位 根 的 
FRR. AWM, 设 上 二 0， 这 是 实践 中 未 知 的 真实 阶 数 ，ADF 检验 统计 量变 成 一 3. 49, p 
值 等 于 0.05019. 因此 ， 有 较 弱 证 据 显示 该 过 程 是 具有 线性 趋势 的 非 平 稳 过 程 ， 即 该 过 程 是 线 
性 时 间 趋 势 加 上 平稳 误差 ， 与 过 程 是 随机 游 动 、 差 分 非 平 稳 的 真实 情况 相反 .， 这 个 例子 说 明 ， 
在 小 样本 下 ， 很 难 区 分 趋势 非 平 稳 和 差分 非 平稳 . 


6.5 其 他 识别 方法 


自从 Box 和 Jenkins 的 初步 工作 之 后 ， 许 多 其 他 的 模型 识别 方法 已 经 被 提出 .研究 最 多 的 
是 赤 池 信息 准则 (Akaike’ s(1973) Information Criterion，AIC)， 这 个 准则 要 求 选择 使 下 式 最 
小 化 的 模型 : 

AIC 一 一 2log( 极 大 似 然 估计 ) + Zk (6.5.1) 

其 中 ， 如 果 模 型 包含 截 距 或 常数 项 ， 则 二 jp 十 gq 十 1; Flbk—ptgq 第 7 章 讨 论 极 大 似 然 佑 
it. 加 项 2(p 十 g 十 1) M2ptq 充当 一 个 “惩罚 范 数 "， 有 助 于 确保 选择 简洁 模型 ， 避 免 选 
择 参 数 太 多 的 模型 . 

AIC 是 估计 模型 与 真实 模型 的 平均 Kullback-Leibler 偏离 的 佑 计量, S PCa yee tts Ya) 
E Yo Yono Y, 的 真实 pdf，g(y yot oyo) 是 参数 为 6 的 模型 相应 的 pdi. qg Sp WY Kull- 
back-Leibler 偏离 由 下 面 的 公式 定义 : 


(= =] oo on CY Veo Yn) 
5 = ana r * 种 H l TRE d seed = 
DC psqa) | 人: | ac yz Yn) Teeraa ydy: * dy 


AIC 估计 了 EC(D(p，gs)]， 其 中 6 是 向 量 参数 6 的 极 大 似 然 估计 ， 但 是，AIC 是 一 个 有 偏 估计 
量 ， 对 于 较 大 的 参数 数量 相对 数据 容量 的 比率 ， 偏 差 会 相当 大 .Hourvich 和 Tsai(1989) WEH , 
通过 在 AIC 中 增加 另 一 个 非 随机 的 惩罚 项 ， 可 以 近似 消除 侦 差 ， 得 到 修正 的 AIC， 记 为 AICe， 
FY PAE X : 


AIC, = AIC+ 24 DATA (6. 5. 2) 


此 处 , nÆ CARMA) 样本 容量 , 有 & 是 除去 品 声 方差 后 的 总 的 参数 数量 . Hurvich 和 Tsai 
(1989) 的 模拟 结果 表明 在 有 /rn 大 于 10% 的 情况 下 ，AICc 表现 优 于 许多 其 他 模型 选择 准则 ， 包 
44 AIC 和 BIC, 
另 一 种 确定 ARMA 阶 数 的 方法 是 选择 一 个 能 使 Schwarz 贝 叶 斯 信息 准则 (Bayesian Infor- 
mation Criterion, BIC) 最 小 的 模型 ， BIC 定义 如 下 : 
BIC 王 一 2log( 极 大 似 然 估计 ) + klog(n) (6. 5. 3) 
如 果真 实 过 程 遵循 ARMAC, 0 模型 ， 则 可 知 通过 最 小 化 BIC 识别 出 的 阶 数 满足 一 致 性 ， 即 
随 着 样本 容量 的 增加 ， 它 们 通 近 真实 阶 数 ， 但是， 如 果真 实 过 程 不 是 有 限 阶 的 ARMA TE, 


© ADF.test (rwalk,selectlags= list (mode= c(1,2,3,4,5,6,7,8),Pmax= 8),itsd= c(1,1,0)). 
© ADF.test (rwalk,selectlags= list (Pmax= 0),itsd= c(1,1,0)). 
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那么 在 日 益 扩 大 的 ARMA 类 模型 中 ， 最 小 化 AIC 具有 有 吸引 力 的 性 质 : 可 以 产生 一 个 最 优 的 
ARMA 模型 ， 即 在 所 研究 的 众多 种 类 的 模型 中 ， 最 接近 真实 过 程 ”. 

无 论 我 们 是 使 用 AIC 还 是 BIC， 都 需要 进行 极 大 似 然 估计 ， 但是， 由 于 似 然 函数 的 多 峰 
性 ，ARMA 模型 的 极 大 似 然 估 计 容 易 产生 计算 问题 ， 并 且 当 AR 和 MA 的 阶 数 超过 真实 的 阶 
- 数 时 ， 也 会 产生 过 度 拟 人 台 问 题 . Hannan 和 Rissanen(1982) 提出 了 一 种 有 趣 且 实用 的 解决 这 
个 问题 的 方法 ， 步骤 是 首先 拟 合 一 个 通过 最 小 化 AIC 确定 的 较 高 阶 数 的 AR 过 程 ， 然 后 用 上 
一 步 得 到 的 残 差 作 为 无 法 观测 的 误差 项 的 代理 变量 这样， 通过 将 时 间 序 列 对 其 E k 
以 及 高 阶 自 回 归 得 到 的 1 至 j 阶 残 差 做 回归 近似 估计 出 一 个 ARMAC, j 模型 ; 该 目 回归 模 
型 的 BIC 是 极 大 似 然 估计 得 到 的 BIC 的 估计 量 ， Hannan 和 Rissanen(1982) 证 明了 最 小 化 近 
似 BIC 仍然 得 到 ARMA 阶 数 的 一 致 估计 量 . 

阶 数 的 确定 是 与 寻找 具有 足够 高 阶 数 的 ARMA 模型 非 零 系数 子 集 的 问题 有 关 的 ， 一 个 子 
集 ARMA(p，g) 模型 是 指 ARMA 模型 系数 的 某 个 子 集 为 零 ， 例 如 ， 模 型 

Y, = 0. 8Y u +e +0. 7e- (6. 5.4) 
是 子 集 ARMA(12，12) BM, WRS ARS THE PBR AA. TAEA be AR- 
MA 模型 ， 比 如 前 面 的 ARMA(12，12) 模型 ， 从 实际 出 发 ， 寻 找 能 充分 近似 潜在 过 程 的 于 集 
ARMA 模型 比 简单 地 确定 阶 数 更 重要 .Hannan 和 Rissanen(1982) 提出 的 估计 ARMA 阶 数 
的 方法 可 以 推广 来 解决 寻找 最 优 子 集 ARMA 模型 的 问题 . 实际 上 ， 子 集 ARMA(p，g) 模型 
(HE prte) 的 几 种 模型 选择 准则 (包括 AIC 和 BIC) 可 以 近似 、 详 尽 、 快 速 地 通过 用 Y, 对 自 
身 的 滞后 项 和 {Y,} 的 高 阶 自 回归 模型 产生 的 残 差 的 滞后 进行 子 集 回归 这 样 跳 牙 式 的 回归 方法 
计算 得 到 (Furnival 和 Wilson, 1974). 

为 得 到 一 些 可 供 深 入 研究 的 有 用 的 初步 模型 ， 检 查 几 个 最 佳 子 集 ARMA 模型 (例如 ， 用 
BIC) 是 明智 的 ， 观 测 时 间 序 列 的 哪些 滞后 项 及 误差 过 程 的 哪些 滞后 项 进 人 不 同 的 最 优 子 集 模 
型 ， 这 些 形态 可 以 简洁 地 汇总 在 如 图 表 6-22 所 显示 的 图 形 中 .该 表 基 于 方程 (6. 5. 4) 表示 的 
ARMA(12，12) 模型 的 模拟 ， 表 的 每 一 行 对 应 着 一 个 子 集 ARMA 模型 ， 模 型 所 选 变量 的 单 
元 格 用 阴影 表示 . 根据 BIC 值 将 模型 分 类 ， 较 好 的 模型 《有 较 低 的 BIC 值 ) 处 于 较 高 的 行 中 ， 
并 且 阴 影 颜 色 也 较 深 ， 最 上 面 一 行 说 明 具 有 最 小 BIC 值 的 子 集 ARMA(14，14) 模型 只 包括 观 
测 时 间 序 列 8、12 阶 澡 后 和 误差 过 程 的 12 阶 滞后 . 其 次 最 好 的 模型 包括 时 间 序 列 12 Be A 
及 误差 过 程 12 阶 滞后 ， 第 三 个 较 好 的 模型 包括 时 间 序 列 4、8、12 阶 沸 后 以 及 误差 过 程 的 12 
阶 灌 后 ， 对 于 我 们 模拟 的 时 间 序 列 来 说 ， 第 二 个 最 好 的 模型 是 真实 的 子 集 模 型 但是， 这 三 个 
模型 的 BIC 值 都 非常 相似 ， 因 此 这 三 个 模型 (加 上 第 4 个 最 好 的 模型 ) 都 值得 进一步 研究 ， 但 
是 ， 汇 总 在 图 表 中 的 不 同 子 集 模型 中 ， 时 间 序 列 的 12 阶 滞后 和 误差 过 程 的 12 阶 沾 后 是 在 不 同 
的 子 集 模 型 中 出 现 得 最 频繁 的 两 个 变量 ， 这 意味 着 它们 可 能 是 更 重要 的 变量 ， 正 如 我 们 已 知 
的 ， 它 们 确实 重要 1 


旺 ” 接 近 程 度 用 Kullback-lLeibler 偏离 来 度量 一 一 是 一 种 度量 模型 之 间 差 距 的 测度 ， Bh Shibata(1976) 和 Stenseth = 
(2004) 的 讨论 . 
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图 表 6-22 基于 BIC 对 最 优 子 集 ARMA 的 选择 


SSNS a 个 一 一 一 一 一 


rm + Pom + Pen + Paa + Peo Paa t Poar Pra t Pest Poe 2 Poe A Pot Poan SPs Poe? Poat Page > Pes” Pea? Pes T Peet Pe t sR F Poe F 


# 和 PRE E E 
EEEE EEEE EETA 


> set.seed (92397) 

> test=arima.sim(model=list (ar=c(rep(0,11),.8), 
ma=c (rep(0,11),0.7)) ,n=120) 

> res=armasubsets (y=test,nar=14,nma=14,y.name='test', 
ar.method='ols') 

> plot (res) 


6.6 一 些 真 实时 间 序 列 的 识别 
现在 我 们 考虑 对 一 些 在 前 面 章节 中 见 过 的 真实 时 间 序列 进行 模型 识别 . 


洛杉矶 年 降雨 量 序列 
洛杉矶 的 年 降雨 总 量 显 示 在 图 表 1-1 中 . 在 第 3 章 的 图 表 3-17 中 ， 我 们 注意 到 年 降雨 量 不 
服从 正 态 分 布 ， 正如 图 表 6-23 显示 的 那样 ， 取 对 数 后 正 态 性 迅速 增强 . 


图 表 6-23 LA 年 降雨 量 对 数 的 QQ EAH 


-2 -l 0 1 2 
理论 分 位 数 。 


> data(larain); win.graph(width=2.5,height=2.5,pointsize=8) 
> qgqnorm(log(larain)); gqqline(log(larain) ) 


模型 识别 95 


图 表 6-24 显示 了 年 降雨 量 序列 取 对 数 后 的 样本 自 相 关 孙 数 . 
图 表 6-24 LA (洛杉矶 ) 年 降雨 量 对 数 的 样本 ACF 


> win.graph(width=4.875,height=3,pointsize=8) 
> acf (log (larain) ,xaxp=c (0,20,10)) 


对 数 变换 提高 了 正 态 性 ， 但 是 该 时 间 序列 不 存在 可 识别 的 相关 性 ， 我 们 可 以 将 年 降雨 量 对 数 
序列 作为 独立 的 、 均 值 为 2. 58、 标 准 差 为 0. 478 的 正 态 随机 变量 来 建 模 ， 这 些 数值 都 以 log( 英 
sh) 为 单位 . oe ne 

化 工 颜色 属性 序列 | a 

图 表 1-3 显示 的 化 工 颜色 属性 序列 让 我 们 对 令 人 感 兴趣 的 时 间 序列 建 模 更 有 信心 一 一 特别 
是 图 表 1-4 显示 的 连续 批 次 的 相关 性 ， 图 表 6-25 画 出 的 样本 ACF 图 ， 乍 一 看 使 人 想到 MAC) 
模型 ， 因 为 只 有 1 OS MRR EBA WE. 


图 表 6-25 颜色 属性 序列 样本 ACF 


> data(color); acf(color,ci.type='ma') 


a 


但 是 ， 图 形 中 明显 衰减 的 正弦 波 促使 我 们 进一步 研究 它 的 样本 偏 自 相关 函数 . 图表 6-26 
展示 了 样本 偏 自 相关 函数 图 ， 现 在 我 们 清楚 地 看 到 ARC) 模型 是 值得 首先 考虑 的 .与 往常 一 
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样 ， 我 们 识别 的 模型 是 试探 性 的 ， 可 以 在 建 模 的 模型 诊断 阶段 进行 修改 . 
a sleds BM 


PACF 


> pacf (color) 


加 拿 大 野 免 年度 丰 度 序列 
图 表 1-5 展示 了 加 拿 大 Hudson 湾 野 免 年 度 丰 度 时 间 序 列 ， 图 表 1-6 表明 了 年 与 年 之 间 的 
相关 性 .文中 曾经 建议 对 数据 进行 变换 以 便 产 生 一 个 更 好 的 模型 ， 图 表 6-27 Ba TEARS 
数 4 函数 的 对 数 似 然 函 数 ， 在 4 二 0.4 时 达到 最 大 值 ,， 但 是 4 二 0.5 的 开 方 变 换 也 在 4 的 置信 区 
间 内 .我 们 将 对 丰 度 值 开 方 后 再 做 进一步 的 分 析 . 
图 表 6-27 Bate BoxCo BEARER 


30 


RT RUA Sh 


> win.graph(width=3,height=3,pointsize=8) 
> data (hare); BoxCox.ar (hare) 


图 表 6-28 显示 了 变换 后 序列 的 样本 ACF. 相当 强 的 IRA K GE SH. (Ae 
再 次 地 ， 图 形 显示 出 很 强 的 阻尼 振 葛 行为 . 
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图 表 6-28 野兔 丰 度 开 方 序列 的 样本 ACF 


> acf (hare”.5) 


图 表 6-29 展示 了 变换 后 时 间 序列 的 样本 偏 自 相关 函数 图 ， 图 形 显示 了 强 有 力 的 证 据 支 持 - 
对 这 些 数据 建立 AR(2) 模型 或 者 AR(3) 模型 . 


图 表 6-29 野兔 丰 度 开 方 序列 的 样本 PACF 


a 一 一 一 一 一 


> pacf (hare” .5) 


石油 价格 序列 

在 第 5 章 ， 我 们 开始 观察 月 度 石油 价格 时 间 序 列 ， 并 且 借 助 图 形 讨 论 了 对 数 差 分 可 以 被 认 
为 是 平稳 的 一 一 参见 图 表 5-1， 用 软件 对 原始 价格 的 对 数 实施 ADF 单位 根 检 验 ， 得 到 检验 统 
计 值 一 1. 1119 以 及 0. 9189 的 户 值 .以 平稳 为 备 择 假设 ， 该 检验 为 非 平 稳 和 对 数 数 据 差 分 是 恰 
当 的 提供 了 强 有 力 的 证 据 ， 该 检验 中 ， 基 于 大 样本 理论 ， 对 方程 (6. 4. 1) ， 软 件 选 择 & 一 6. 

图 表 6-30 展示 了 石油 价格 数据 对 数 差 分 的 EACF 汇总 表 . 该 表 建 议 设 定 p=0, g=1H 
ARMA 模型 . 

图 表 6-30 石油 价格 序列 对 数 差 分 的 扩展 的 ACF 


AR/MA ü 1 2 4 5 6 7 8 9 10 11 12 13 
0 X o o 0 D o 总 全 D ü o o a 
l X x O a 0 o (a) 局 0 a x g oO ‘a 
2 E X o ü g D o o O ü Ù o a] ü 
3 ü x a 0 o oO o 口 总 o o oO a o 
4 ü x x 0 D ü 0 o o D Q D O 0 
与 ü x a x o O 0 o 0 oO 0 o a oO 
ú o X a X o O o Q O o D D o D 
7 X x o x 0 D o Q 0 oO D O ü D 


p -'__§  Oe=<Sc_ 


> eacf (diff(log(oil.price))) 


RETR ARMA 法 的 结果 展示 在 图 表 6-31 中 . 
图 表 6-31 对 Ilog(Oil) 差分 的 最 优 子 集 ARMA 模型 


E È t È & É E 
人 
E 安家 处 家 R - an 
E A NAARAAT F FF RK KE 办 
T 2 RR RR KR HE HR HR HH HH H 

RR Rk RR RK KR KOK OR R R 


> res=armasubsets (y=diff (log(oil.price)) ,nar=7,nma=7, 
y-.name='test', ar.method='ols') 
> plot (res) 


ZE, RIKERE Y, =V log(Oil,) MH Y- 和 了-: 来 建 模 ， 并 且 误 差 部 分 不 需要 灌 
后 项 .第 二 个 最 优 模型 去 掉 了 4 阶 滞后 ， 因 此 也 应 当 进一步 研究 取 对 数 后 数据 的 ARIMA(1， 
1，0) 模型 . 

图 表 6-32 建议 我 们 对 石油 价格 对 数 差 分 序列 设 定 MA(1) 模型 ， 图 表 6-33 表明 应 该 考虑 
AR(2) 模型 (忽略 那些 在 15、16 和 20 阶 滞后 处 显著 的 尖峰 值 )， 当 我 们 在 第 7 章 和 第 8 章 进 
行 参数 估计 和 诊断 检验 时 ， 将 会 进一步 研究 所 有 这 些 模 型 .后 面 我 们 会 发 现 ， 为 了 获得 石油 价 
格 序列 的 合适 的 模型 ， 序 列 中 的 异常 值 需要 被 处 理 . (发 现 图 表 5-4 中 的 异常 值 了 吗 ?) 


图 表 6-32 石油 价格 对 数 差分 的 样本 ACF 


2 4 6 8 10 12 14 16 18 20 22 
滞后 


> acf (as.vector (diff (log (oil.price))),xaxp=c{(0,22,11)) 


we FB! aR FY : 99 


图 表 6-33 石油 价格 对 数 差 分 的 样本 PACF 


2 4 6 B 10 12 14 16 18 20 22 
itl 


> pacf (as .vector (diff (log(oil.price))),xaxp=c(0,22,11)) 


6.7 小 结 


本 章 我 们 讨论 了 对 观测 时 间 序 列 设 定 合理 但 简单 的 模型 的 问题 ， 特别 是 ， 我 们 研究 了 选择 
ARIMA(p, d, P NKRA p, dMq) 的 工具 ， 我 们 介绍 并 研究 了 三 种 工具 一 一 样本 日 相 
关 函 数 、 样 本 偏 自 相关 函数 和 样本 扩展 的 自 相关 函数 ， 来 帮助 解决 这 个 困难 的 问题 。 我 们 还 介 
绍 了 Dickey-Fuller 单位 根 检验 ， 来 区 分 平稳 和 非 平稳 序列 .我 们 使 用 了 模拟 的 和 真实 的 时 间 
序列 来 说 明 这 些 概念 . 


习题 
6.1 对 白 噪 声 过 程 证 明 方 程 〈6. 1. 3) 成 立 . 
6.2 W ARO) 过 程 证 明 方程 〈6. 1. 4) Moz. 
6.3 证 明 图 表 6-1 中 d= 10.9 一 行 的 结果 . 
6.4 为 图 表 6-1 增加 新 行 ， 使 用 下 列 数值 : 
(a) $= +0. 99. ; 
(b) ¢=+0. 5. 
(c) $= 0.1. 
6.5 W MAO) 过 程 证 明 方程 (6.1.9) 和 方程 (6.1.10) 成 立 . 
6.6 证 明 图 表 6-2 中 6 一 土 0.9 一 行 的 结果 ， 
6.7 为 图 表 6-2 增加 新 行 ， 使 用 下 列 数 值 : 
(a) @==0. 99. 
(b) 0= 0. 8. 
(c) @==0. 2. 
6.8 对 一 般 MA(g) 过 程 证 明 方 程 (6. 1. 11) 成 立 . 
6.9 ”用 方程 (6.2.3) 证 明 方程 (6.2.5) 给 出 的 MA(1) 过 程 的 2 阶 滞后 偏 自 相关 系数 计算 
公式 成 立 ， 
6.10 ”证明 方程 (6. 2.6) 给 出 的 计算 MAC) 过 程 的 偏 自 相 关 函 数 的 一 般 表 达 式 满足 方程 
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(6.2.7) 给 出 的 Yule-Walker 递归 式 . 

用 方程 (6.2.8) HEA p Ad, 以 及 滞后 A=1,2,3,… 表 示 的 AR(2) 模型 的 《理论 ) 
偏 自 相关 上 函数 . 

用 具有 100 个 观测 值 的 时 间 序 列 ， 我 们 计算 出 7 二 一 0.49, rr; 二 0.31, rr; 二 一 0.21， 
r,=0.11, H% k>48f, [ri | 二 0.09. 只 基于 这 些 条 件 ， 我 们 会 为 该 序列 试探 性 地 设 
定 什么 样 的 ARIMA 模型 ? 

用 一 个 长 度 为 121 的 平稳 时 间 序 列 计算 得 到 样本 偏 自 相关 系数 : 名, 二 0.8，%$%, 二 一 0. 6， 
多, 一 0. 08 和 ,二 0. 00， 只 基于 这 些 信息 ， 我 们 会 为 该 序列 试探 性 地 设 定 什 么 样 的 
模型 ? 

对 一 个 长 度 为 169 的 序列 ， 我 们 求 得 r =0.41, r,=0.32, r3=0. 26, r, =0. 21, r; = 
0.16. 什么 样 的 ARIMA 模型 适合 这 种 自 相 关 模 式 ? 

某 序列 及 其 一 阶 差 分 序列 的 样本 ACF 列 于 下 表 ， 此 处 n=100. 


滞后 1 2 3 4 5 6 
Y, 的 ACF 0.97 0.97 0.93 0. 85 0. 80 0. 71 
VY, & ACF 一 0. 42 0.18 一 0. 02 0.07 一 0. 10 一 0. 09 


只 基于 这 些 信 息 ， 我 们 会 为 该 序列 考虑 什么 样 的 ARIMA 模型 ? 
对 一 个 长 度 为 64 的 序列 ， 样 本 偏 自 相关 郴 数 如 下 : 

a 1 2 3 4 5 

PACF 0. 47 —0. 34 0. 20 0. 02 —/(). 06 

这 种 情况 下 ， 我 们 应 该 考虑 什么 样 的 模型 ? 
考虑 一 个 长 度 为 100,， $= 二 0.7 的 ARCO) FJI. 

(a) 如 果 rl 一 0.6， 你 会 感到 奇怪 吗 ? 

(b) mo 一 一 0. 15 异常 吗 ? 

假设 (X) 是 一 个 参数 为 $ 的 平稳 AR(1) 过 程 ， 但 是 我 们 只 能 观察 到 Y, 一 X, 十 N,， 其 
中 {N,} 是 独立 于 (X) 的 白 品 声 测量 误差 , 

(a) 求 出 观测 过 程 的 用 %，cg 和 o% RAH A AK HR. 

(b) 我 们 可 能 会 为 {Y,} 设 定 什么 样 的 ARIMA 模型 ? 

两 个 序列 的 时 间 序 列 图 显示 如 下 : 

(a) 对 每 一 个 序列 ， 用 术语 高 度 正 相关 、 中 等 正 相 关 、 近 似 为 0、 中 等 负 相 关 和 高 度 负 

相关 来 描述 ri/， 为 了 回答 该 问题 ， 需 要 知道 该 序列 的 测度 单位 吗 ? 
(b) Hrn 重复 (a) 的 问题 . 


序列 A 
序列 B 
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6.20 模拟 n=48, $=0.7 W ARG) 时 间 序 列 . 


6.21 


6. 23 


6.24 


(a) 计算 该 模型 在 1 阶 和 5 阶 滞后 处 的 理论 自 相 关系 数 . 

(b) 计算 1 阶 和 5 阶 滞后 处 样本 自 相 关系 数 ， 并 将 其 与 理论 自 相关 值 进 行 比较 . 用 方程 
(6.1.5) 和 (6.1.6) 量化 这 个 比较 . 

(c) 使 用 新 的 模拟 重复 (b). 描述 在 相同 条 件 下 ， 估 计 的 精度 如 何 随 所 选 样 本 的 不 同 而 
AB AL. 

(d) 如 果 软 件 允 许 ， 重 复 模拟 序列 并 多 次 计算 n 和 rs;， 并 且 构 建 r 和 rs 的 样本 分 布 . 
描述 估计 的 精度 如 何 随 着 相同 条 件 下 所 选择 的 样本 的 不 同 而 变化 . 方程 (6. 1. 5) 
给 出 的 大 样本 方差 与 你 的 样本 分 布 的 方差 接近 程度 如 何 ? 

模拟 n=60, G=0.5 的 MAC1) 时 间 序 列 . 

(a) 计算 该 模型 1 阶 滞后 处 的 理论 自 相关 系数 . 

(b) 计算 1 阶 滞后 处 样本 自 相关 系数 ， 并 将 其 与 理论 自 相 关系 数 进 行 比较 . 用 图 表 6-2 
量化 这 个 比较 . 

(c) 使 用 新 的 模拟 重复 (b). 描述 在 相同 条 件 下 ， 估 计 的 精度 如 何 随 所 选 样本 的 不 同 而 
变化 . 

(d) 如 果 软 件 允 许 ， 重 复 模 拟 序 列 并 多 次 计算 n, HAW 7 的 样本 分 布 ， 描 述 估计 
的 精度 如 何 随 着 相同 条 件 下 所 选择 样本 的 不 同 而 变化 ， 图 表 6-2 给 出 的 大 样本 方差 
与 你 的 样本 分 布 的 方差 接近 程度 如 何 ? 

模拟 n=48 的 ARC) 时 间 序 列 . 

(a) 4 $=0.9 时， 计算 1 阶 滞后 和 5 阶 滞后 处 的 理论 自 相 关系 数 . 

(b) 4 $=0.6 时 ， 计算 1 阶 滞后 和 5 阶 滞后 处 的 理论 自 相 关系 数 . 

(c) 当 $= 二 0.3 时 ， 计算 1 阶 滞后 和 5 阶 滞后 处 的 理论 自 相 关系 数 . 

(d) 对 Ca), (b), C9 中 的 每 个 序列 ， 分 别 计 算 1 阶 滞后 和 5 阶 滞后 处 样本 自 相 关系 
数 并 与 理论 值 进行 比较 ， 用 方程 (6.1.5) 和 (6.1.6) 量化 这 些 比较 . 简要 描述 估 
计 的 精度 如 何 随 着 $ 值 的 变化 而 变化 . 

模拟 $= 二 0.6 的 ARC) 时 间 序 列 . 

(a) mn 一 24， 估 计 m 一 g% 一 0.6 和 六， 

(b) n=60, fhit p =$=0.6 和 r. 

(c) n=120, {hit o =¢=0.6 M r. 

(d) 对 (a). (b), (oc) 中 的 每 个 序列 ， 比 较 理 论 值 与 估计 值 . 用 方程 (6.1.5) 量化 这 
些 比较 ， 简 要 描述 估计 的 精度 如 何 随 着 样本 容量 的 变化 而 变化 ， 

模拟 O=0.7 的 MAC) 时 间 序 列 . 

(a) n=24, fhit a An. 

(b) n=60, 估计 p Mri. 

(c) n=120, 估计 p Mr. 

(d) xt (a), (b), (co) 中 的 每 个 序列 ， 比 较 wm 的 估计 值 和 理论 值 ， 用 图 表 6-2 量化 这 
些 比较 ， 简 要 描述 估计 的 精度 如 何 随 着 样本 容量 的 变化 而 变化 . 

模拟 一 个 长 度 n=36, $=0.7 的 ARC) 时 间 序 列 ， 
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6. 26 


6. 27 


6. 28 


6. 29 
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(a) 计算 并 画 出 该 模型 的 理论 自 相 关 函 数 ， 画 出 足够 多 的 滞后 项 直到 相关 性 可 以 忽略 
Ait. 

(b) 计算 并 画 出 模拟 序列 的 样本 ACF， 样 本 值 和 模式 与 (a) 部 分 的 理论 ACF 匹配 程 
度 如 何 ? 

(O 该 模型 的 理论 偏 自 相关 函数 是 什么 ? 

Cd) 计算 并 画 出 模拟 序列 的 样本 ACF， 样 本 值 和 模式 与 (a) 部 分 的 理论 ACF 匹配 程 
Eit? AERA 6-1 列 出 的 大 样本 标准 误差 量化 你 的 答案 . 

Ce) 计算 并 画 出 模拟 序列 的 样本 PACF. 样本 值 和 模式 与 Cc) 部 分 的 理论 PACF 匹配 
程度 如 何 ? 用 列 出 的 大 样本 标准 误差 量化 你 的 管 案 . 

模拟 一 个 长 度 n=48, 0=0.5 的 MAC) 时 间 序 列 . 

(a) 该 模型 的 理论 自 相 关 郴 数 是 什么 ? | 

(b) 计算 并 画 出 模拟 序列 的 样本 ACF， 样 本 值 和 模式 与 (a) 部 分 的 理论 ACF 匹配 程 
度 如 何 ? 

(c) 计算 并 画 出 模型 的 理论 偏 自 相 关 函 数 . 画 出 足够 多 的 滞后 项 直到 相关 性 可 以 忽略 不 
计 . (427; 参见 方程 (6. 2. 6).) 

(dO 计算 并 画 出 模拟 序列 的 样本 PACF. 样本 值 和 模式 与 Cc) 部 分 的 理论 PACF 匹配 
程度 如 何 ? 

模拟 一 个 长 度 n=72, $,=0.7, & =—0.4 的 ARC) 时 间 序 列 . 

(a) 计算 并 画 出 该 模型 的 理论 自 相 关 函 数 ， 画 出 足够 多 的 滞后 项 ， 直 到 相关 性 可 以 忽略 
不 计 ， 

(b) 计算 并 画 出 模拟 序列 的 样本 ACF. 样本 值 和 模式 与 (2) 部 分 的 理论 ACF 匹配 程 
度 如 何 ? 

(c) BRAM iti AKITA? 

(d) 计算 并 画 出 模拟 序列 的 样本 ACE. 样本 值 和 模式 与 (a) 部 分 的 理论 ACF 匹配 程 
度 如 何 ? 

Ce) 计算 并 画 出 模拟 序列 的 样本 PACF. 样本 值 和 模式 与 〈c) 部 分 的 理论 PACF 匹配 
程度 如 何 ? 

模拟 一 个 长 度 n=36, 6,=0.7, 6: =—0.4 的 MA(2) 时 间 序 列 ， 

(a) 该 模型 的 理论 目 相 关 函 数 是 什么 ? 

(b 计算 并 画 出 模拟 序列 的 样本 ACF， 样 本 值 和 模式 与 “a》 部 分 的 理论 ACF 匹配 程 
度 如 何 ? 

(c) 画 出 模型 的 理论 偏 自 相 关 函 数 ， 画 出 足够 多 的 浅 后 项 ， 直到 相关 性 可 以 忽略 不 计 . 
(我 们 没有 计算 这 个 模型 的 PACE 的 公式 .， 相反， 我 们 对 这 个 模型 进行 一 个 非常 大 
的 样本 模拟 ， 例 如 上” 王 1000， 计 算 并 画 出 这 个 模拟 的 样本 PACF). 

(d) 计算 并 画 出 (a) 部 分 模拟 序列 的 样本 PACF. Fe ARE BRA SS Cc) 部 分 的 “ 理 
论 ”PACEF 匹配 程度 如 何 ? 

模拟 一 个 长 度 n=60, $=0.4, 6=0.6 的 混合 ARMAC, 1). 模型 . 

(a) HEH MARC AMER. 画 出 足够 多 的 请 后 项 ， 直 到 相关 性 可 以 忽略 
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6. 30 


6. 31 


6. 32 


6. 33 


不 计 . 

(Cb) 计算 并 画 出 模拟 序列 的 样本 ACF. 样本 值 和 模式 与 (a) 部 分 的 理论 ACF 匹配 程 
度 如 何 ? 

(c) 计算 并 解释 该 序列 的 样本 EACF. EACF 有 助 于 你 为 这 个 模型 设 定 正确 的 阶 数 吗 ? 

(d) 用 相同 参数 和 样本 容量 得 到 一 个 新 的 模拟 ， 重 复 Cb) 和 (c) 部 分 . 

(e) 用 相同 参数 值 ， 但 是 样本 容量 n=36 得 到 一 个 新 的 模拟 ， 重 复 (b) 和 C MF. 

(f) 用 相同 参数 值 ， 但 是 样本 容量 n=120 得 到 一 个 新 的 模拟 ， 重 复 b Al Cc) 部 分 . 

模拟 一 个 长 度 n=100, $=0.8, 0=0. 4 的 混合 ARMA(1，1)》 模型 . 

(a) 计算 并 画 出 该 模型 的 理论 自 相 关 函 数 . 画 出 足够 多 的 滞后 项 ， 直 到 相关 性 可 以 忽略 
不 计 . 

(b) 计算 并 画 出 模拟 序列 的 样本 ACF， 样 本 值 和 模式 与 (a〉 部 分 的 理论 ACF LAE 
度 如 何 ? 

(c) 计算 并 解释 该 序列 的 样本 EACF. EACF 有 助 于 你 为 这 个 模型 设 定 正确 的 阶 数 吗 ? 

(d) 用 相同 参数 和 样本 容量 得 到 一 个 新 的 模拟 ， 重 复 (b) 和 (c) 部 分 . 

(e) 用 相同 参数 值 ， 但 是 样本 容量 "一 48 得 到 一 个 新 的 模拟 ,重复 (b) 和 Cc) 部 分 . 

Cf) 用 相同 参数 值 ， 但 是 样本 容量 n=200 得 到 一 个 新 的 模拟 ， 重 复 Cb) 和 (c) 部 分 . 

根据 0 二 0.8 的 ARIMA(0， l, 1) 模型 模拟 一 个 7 一 00 的 非 平 稳 时 间 序 列 . 

(a) QF (6.4.1) P k=0 对 序列 进行 (增强 的 ) Dickey-Fuller 检验 . C k=0 时 是 
Dickey-Fuller 检验 ， 不 是 增强 的 Dickey-Fuller 检验 . )， 并 对 结果 进行 评论 . 

(b) 对 序列 进行 ADF 检验 ， 其 中 & 通 过 软件 选择 ， 即 选择 “最 优 ” 的 & 值 . 对 结果 进 
行 评论 . 

(c) 用 模拟 序列 的 差分 重复 (a) 和 b) 部 分 ， 对 结果 进行 评论 . 〈 当 然 ， 此 时 应 拒绝 
单位 根 假 设 . ) 

根据 4=0.95 的 ARC) 模型 模拟 一 个 n=36 的 平稳 时 间 序 列 ， 该 模型 是 平稳 的 ， 但 也 

仅 此 而 已 ， 对 这 样 的 模型 和 较 短 的 历史 数据 ， 在 平稳 与 有 单位 根 的 非 平 稳 之 间 进 行 区 分 

即使 不 是 不 可 能 的 也 是 非常 困难 的 . 

(a) 画 出 时 间 序 列 图 ， 计 算 样 本 ACF Al PACK, 描述 你 所 看 到 的 结果 . 

(b) 令 方 程 (6.4.1) 中 =0 对 该 序列 进行 〈 增 强 的 ) Dickey-Fuller 检验 . (k=0 时 是 
Dickey-Fuller 检验 ， 不 是 增强 的 Dickey-Fuller 检验 . ) 对 结果 进行 评论 . 

(c) 对 序列 进行 ADF 检验 , & MURR, WR “RH” Hk. 对 结果 进行 

(d) 用 一 个 n=100 的 新 的 模拟 序列 重复 (a) 和 Cb) 部 分 . 对 结果 进行 评论 . 

名 为 deerel 的 数据 文件 包含 了 82 个 连续 的 值 〈 以 0. 000 025 英寸 为 单位 )， 这 些 值 是 在 

某 些 指定 操作 条 件 下 Deere 公司 的 机 床 产 生 的 相对 某 个 设 定 目 标的 偏离 程度 . 

(a) 展示 该 序列 的 时 间 序 列 图 ， 并 对 任何 异常 点 进行 评论 . 

(b) 计算 序列 的 样本 ACF， 并 对 结果 进行 评论 . 

(c) 现在 用 更 典型 的 值 代替 异常 值 ， 然 后 重新 计算 样本 ACF. 对 与 〈b) MOAR MS 
果 进 行 评论 . 
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6. 34 


6. 35 


6. 36 


6. 37 


6. 38 


6. 39 
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(d) EF (co) 部 分 使 用 过 的 修改 后 的 序列 计算 样本 PACF. 对 修正 的 序列 ， 你 将 设 定 
什么 样 的 模型 ? 〈 稍 后 我 们 将 研究 在 时 间 序 列 建 模 中 处 理 异 常 值 的 其 他 方法 . ) 

名 为 deere2 的 数据 文件 包含 了 102 个 连续 的 值 〈 以 0. 000 002 5 英寸 为 单位 )， 这 些 值 是 

Deere 公司 的 另外 一 个 机 床 产生 的 相对 某 个 设 定 目标 的 偏离 程度 . 

(a) 展示 该 序列 的 时 间 序 列 图 ， 并 对 图 形 进行 评论 .平稳 模型 看 起 来 合适 吗 ? 

(b) 展示 该 序列 的 样本 ACF 和 PACF， 为 该 序列 的 ARMA 模型 选择 试探 性 的 阶 数 . 

名 为 deere3 的 数据 文件 包含 了 57 个 连续 的 测量 值 ， 该 记录 来 自 Deere 公司 的 一 个 复杂 

的 机 床 ， 所 给 值 是 相对 某 目 标 值 的 偏离 程度 ， 以 千 万 分 之 一 英寸 为 单位 .该 过 程 使 用 一 

个 控制 装置 根据 上 一 次 偏离 目标 值 的 程度 来 重 置 机 床 的 某 些 参数 . 

(a) 展示 该 序列 的 时 间 序 列 图 ， 并 对 图 形 进行 评论 ， 这 里 平稳 模型 合适 吗 ? 

(b) 展示 该 序列 的 样本 ACF 和 PACF， 为 该 序列 的 ARMA 模型 选择 试探 性 的 阶 数 . 

名 为 robot 的 数据 文件 包含 了 来 自 工业 机 器 人 的 时 间 序 列 . 机 器 人 需要 完成 一 系列 的 动 

作 ， 与 目标 终点 的 距离 以 英寸 为 单位 被 记录 下 来 . 重复 324 次 得 到 该 时 间 序 列 . 

(a) 展示 数据 的 时 间 序 列 图 . 基于 这 些 信 息 ， 这 些 数据 看 起 来 是 来 自 平稳 过 程 还 是 非 平 
稳 过 程 ? 

(b) 计算 并 画 出 这 些 数据 的 样本 ACF H PACF. 基于 这 些 附 加 信息 ， 这 些 数据 看 起 来 
是 来 自 平 稳 过 程 还 是 非 平 稳 过 程 ? 

(c) 计算 并 解释 样本 EACF. 

(dd) 用 最 优 子 集 ARMA 法 为 这 些 数据 设 定 模型 ， 与 你 在 a), (b), C) 部 分 得 到 的 结 
果 进 行 比 较 . 

计算 并 解释 洛杉矶 降雨 量 的 对 数 序 列 的 样本 EACF. 数据 在 名 为 larain 的 文件 中 .这 些 

结果 能 够 证 明 该 对 数 序列 是 白 品 声 吗 ? 

计算 并 解释 颜色 属性 时 间 序 列 的 样本 EACF， 数 据 在 名 为 color 的 文件 中 . 样本 EACF 

建议 的 模型 与 通过 观察 样本 PACF 设 定 的 模型 相同 吗 ? 

名 为 days 的 数据 文件 包含 来 自 艾 奥 瓦 州 伯 灵 顿 市 的 Winegard 公司 的 会 计数 据 . 数据 是 

从 Winegard 产品 某 特定 分 销 商 那 里 收 到 的 130 个 连续 订单 的 付款 的 天 数 ， (出 于 机 密 ， 

分 销 商 的 名 称 必 须 是 匿名 的 . ) 

(a) 画 出 时 间 序 列 图 ， 对 图 形 作出 评论 。 图 中 有 异常 值 吗 ? 

(b) 计算 该 序列 的 样本 ACF 和 PACF. 

(c) 现在 将 异常 值 替换 为 35 天 一 一 更 典型 的 值 ， 重 复 计 算 样本 ACF 和 PACF. 对 除去 
异常 值 后 的 序列 ， 你 将 设 定 什么 样 的 ARMA 模型 ? 〈 稍 后 我 们 将 研究 在 时 间 序 列 建 
模 中 处 理 异 常 值 的 其 他 方法 . ) 


第 7 章 参数 估计 


本 章 主要 论述 如 何 基 于 观测 时 间 序 列 Y, ,Y,,…,Y, 对 ARIMA 模型 进行 参数 估计 的 问题 . 
这 里 假设 已 识别 了 模型 ， 即 已 用 第 6 章 的 方法 确定 了 pp，d 和 4 的 值 ， 至 于 非 平稳 性 ， 由 于 假 
定 观 测序 列 的 a 次 差分 是 平稳 的 ARMA(p，gq) 过 程 ， 故 只 需 关 心 在 这 类 平稳 模型 中 的 参数 估 
计 问 题 即 可 .实际 上 ， 我 们 把 原始 时 间 序 列 经 过 ad 次 差分 所 得 的 序列 作为 对 完整 模型 参数 进行 
估计 的 对 象 ， 简 单 起 见 ， 令 了, ,Y,,…,Y, 表示 观测 到 的 平稳 过 程 ， 即 便 它 有 可 能 是 原始 序列 
经 适当 差分 后 得 到 的 过 程 . 首先 讨论 矩 估 计 方 法 ， 继 而 介绍 最 小 二 乘 估 计 ， 最 后 介绍 完整 的 极 
大 似 然 估 计 . 


7.1 tiit 


即便 不 被 看 做 是 最 有 效 的 方法 ， 矩 估计 法 也 常 被 视 为 求 取 估 计 参 数 最 简单 的 方法 之 一 .此 
方法 通过 令 样 本 矩 等 于 相应 的 理论 和 矩 ， 并 求解 所 得 方程 以 求 得 任意 未 知 参 数 的 估计 . 使 用 该 方 
法 最 简单 的 例子 是 通过 样本 均值 来 估计 平稳 过 程 的 均值 ， 在 第 3 章 里 已 经 充分 讨论 过 这 一 估计 
量 的 性 质 . 

自 回归 模型 

首先 讨论 ARCO) 的 情况 . 此 过 程 具 有 简单 的 关系 a=. HAH, Oo Fn, B 
一 阶 滞后 样本 自 相 关系 数 . 因此 可 用 下 式 估 计 #: 

$=n (7.1.1) 

下 面 讨论 AR(2) 的 情况 .参数 和 与 加 之 间 的 关系 由 Yule-Walker 方程 (4. 3. 13) .给 出 : 

p = $: totes pz 二 pi 办 十 由 
HEHEH n RE om #H r 代替 ps ， 得 到 

n =$ tnp, n= nh ts, 
然后 求解 得 到 


ri(l— 7,) _r—ni 
(=a er (7.1. 2) 


一 般 ARC) 的 情况 过 程 类 似 ， 在 56 页 (或 81 页 ) 整个 Yule-Walker 方程 中 用 n 代替 pi» 
得 到 | 


$i + ri $2 + rzg + +rpity = 
ri? + $: + r$, +s +r,2?> 7 re (7.1.3) 
rah 十 Tesh t rests tet $%=r, 
求解 该 线性 方程 组 得 到 加 h ,… ,$,。 Durbin-Levinson 递 推 方程 (6.2.9) 提供 了 一 个 简便 的 解 
法 ， 但 是 如 果 解 接近 平稳 域 的 边界 ， 则 会 产生 较 大 的 含 人 误差 . 这样 得 到 的 估计 也 被 称 为 
Yule-Walker 估计 ， 
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滑动 平均 模型 
令 人 惊讶 的 是 ， 当 用 于 滑动 平均 模型 时 ， 甜 估计 就 不 那么 简便 了 . 考虑 简单 的 MA(1) 的 


情况 ， 从 方程 (4.2.2) 可 知 ， 


SORRE 
rs 1+¢ 


令 po 等 于 7r!， 则 问题 转化 为 求解 一 个 关于 OMAK. WR |r | 二 0.5， 那 么 两 个 实数 根 给 


出 如 下 : 
ees /1 _ 
2r, T 4r? l 


容易 验证 ， 两 个 解 的 乘积 总 是 等 于 1. 因此， 只 有 一 个 解 满足 可 逆 条 件 10| 一 1. 
经 过 进一步 的 代数 处 理 ， 可 以 看 到 可 首 解 能 够 写 为 


g— city i (7.1.4) 
如 果 r,=+0.5, A EME— ASR, BMF BARRETTA. 如果 | | 0. 5E |o |<0.5, 
该 式 也 当然 有 可 能 成 立 )， 不 存在 实数 解 ， 因 而 通过 和 矩 估 计 法 得 不 出 9 的 估计 量 . 当然， 如 果 
Irn | 守 0. 5， 把 模型 设 定 为 MA(1) 就 会 存在 相当 的 疑问 . 

对 于 高 阶 MA 模型 ， 矩 估计 将 迅速 复杂 化 ， 可 以 利用 方程 (4. 2. 5)， 对 有 = 二 1,2,…,q， 用 
r 代替 or» BAS g 个 未 知 量 9 ,0: ,…，,b 的 g 个 方程 ， 所 得 方程 组 关于 这 些 9 是 高 度 非 线性 
的 ， 因 而 不 可 避免 地 只 能 求 得 数值 解 ， 另 外， 方程 组 有 多 个 解 ， 但 其 中 仅 有 一 个 是 可 道 的 .在 
7. 4 节 将 会 看 到 ， 对 MA 模型 而 言 ， 通 过 和 矩 估计 方法 所 得 结果 一 般 较 差 ， 因 此 这 里 不 再 做 进 一 
步 的 探讨 . 

混合 模型 

我 们 只 考虑 ARMAC, 1) 的 情况 .回忆 方程 (4.4.5): 


Merna e E a 


注意 ps /pi 二 $， 首 先 估计 为 
$ 一 (7.1.5) 


然后 ， 可 以 使 用 
_ (1—0($—0) 
E TE C7 2 loe 
来 求解 A 需要 再 次 提醒 的 是 ， 必 须 求解 一 个 二 次 方程 ， 并 仅 保留 其 可 逆 解 ， 假 如 存在 的 话 . 
噪声 方差 估计 


最 后 需要 估计 的 参数 是 噪声 方差 于， 任何 情况 下 ， 首 先 都 可 以 通过 如 下 样本 方差 来 估计 过 
程 的 方差 Yo = Var(Y,): 


$= Dy, -Yy (7.1.7) 
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并 使 用 第 4 Pe AMY. o 和 所 有 2， $ Si KARAT oF. 
对 AR(p) 模型 ， 方 程 (4. 3. 31) 能 够 导出 


6 = (lin hr Br” none 
特别 地 ， 对 ARG) 过 程 ， 因 为 g% 一 ” ， 所 以 
a = (1—7*)s5’ 
对 MAQ) 的 情况 ， 使 用 方程 (4.2.4), A. 
a= a ETEY. (7.1.9) 
对 ARMAC, 1) 过 程 ， 由 方程 (4.4.4) 可 推出 
0 一 Ar y (7.1.10) 
1—2 +f 


数值 例题 

图 表 7-1 展示 了 若干 模拟 时 间 序 列 参数 的 矩 估 计 ， 一 般 说 来 ， 所 有 自 回 归 模型 的 估计 都 相 
当 好 ， 而 滑动 平均 模型 的 估计 则 不 可 接受 ， 通 过 理论 证 明 可 确认 此 现象 一 一 在 模型 带 有 滑动 平 
均 项 时 甜 佑 计量 极其 低 效 . | 


图 表 7-1 模拟 序列 参数 的 矩 估计 


| 0. 4 

1. 5 
data(mal.2.s); data(mal.1.s); data(mal.3.s); data(mal.4.s) 
estimate.mal.mom(mal.2.s); estimate.mal.mom(mal.1.s) 
estimate.mal.mom(mal.3.s); estimate.mal.mom(mal.4.s) 
arima (mal.4.s,order=c(0,0,1),method='CSS', include.meéan=F) 
data(arl.s); data(arl.2.s) 
ar(arl.s,order.max=1,AIC=F,method='yw')} 
ar (arl.2.s,order.max=1,AIC=F,method='yw') 
data {ar2.s) 
ar (ar2.s,order.max=2,AIC=F,method='yw') 


OA AMR n =0. 544, MR PEE. 


现在 考虑 几 个 实际 的 时 间 序 列 ， 从 加 拿 大 野兔 丰 度 序列 开始 .在 图 表 6-27 PO RB, 3 
入 开 方 变换 是 恰当 的 ， 因 此 这 里 所 有 模型 的 建立 都 将 基于 原始 丰 度 数值 的 平方 根 . 虽然 以 后 将 
会 说 明 ARG) 模型 对 数据 拟 合 得 更 好 ， 但 这 里 仍 用 野 免 数 据 的 AR(2) 模型 来 对 估计 加 以 说 
BH. 图 表 6-28 中 所 示 的 前 两 个 自 相 关系 数 分 别 是 二 0.736 M r: =0. 304. 使 用 方程 〈7. 1. 2)， 


VY VV VV YY V 
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$ Alb. FAB fa Ht FE 


和 


E 7 
rr 0.304— (0.736 
h 一 l—re 1 一 (0.736)2 on? 


得 出 该 序列 的 样本 均值 和 方差 (已 对 原始 数据 开平 方 ) 分 别 是 5. 82 和 5. 88， 然 后 ， 


(7. 1. 8) ， 佑 计 品 声 方差 为 
a = (l—¢,r, —¢,r2)s° 

= [1 — (1. 1178) (0. 736) — (— 0. 519) (0. 304) ](5. 88) 

= 1.57 
则 估计 模型 (用 原来 的 符号 表示 ) 是 

JY, — 5.82 = 1.1178(./Y_, — 5. 82) — 0. 519( VY: — 5.82) +e, 
或 
JY, = 2.335 +1. 1178 yY —0.519 yY: +e, 

佑 计 的 噪声 方差 是 1. 97. 


de Ll) 


(7.1.12) 


使 用 方程 


(7. 1. 13) 


(7.1. 14) 


(7.1.15) 


下 面 考虑 石油 价格 序列 .根据 图 表 6-32， 序 列 经 过 取 对 数 并 进行 一 次 差分 后 ， 所 得 的 序列 
可 以 设 定 为 MA(1) 模型 ， 图 中 ， 一 阶 滞后 样本 自 相关 系数 等 于 0.212， 因 此 2 的 矩 估 计 是 


— = 2 
A 一 1]+ v1l— 40. 212) —— 9, 299 


g 2 (0. 212) 
对 数 差 分 后 所 得 序列 的 均值 是 0. 004, JAE 0.0072. 估计 模型 为 
V log(Y,) = 0.004 + e, +0. 222e,, 
或 
log(¥,) = log(Y,-,) +0. 004 + e, 十 0.222e 1 
估计 的 哗 声 方差 是 


È 
5 s 一 9.0072 _ __ 9) 006 86 


"IFF 1+ 0.222) 


(7. 1, 16) 


(7. 1. 17) 


(7. 1. 18) 


(7. 1. 19) 


使 用 带 估计 的 参数 的 方程 (3. 2. 3) 可 得 样本 均值 0. 0060 的 一 个 标准 误差 ， 因 此 观测 到 的 样本 


均值 0. 004 并 非 显 著 地 异 于 0， 故 可 从 模型 中 去 掉 常数 项 ， 得 到 最 终 的 模型 : 
log(Y,) = log(Y, 1) +e, 十 0.222e 1 


7.2 最 小 二 乘 估计 


(7. 1. 20) 


AES EMA EUS ASR, MUA ee BI. 下面 先 介 
绍 最 小 二 乘法 ， 对 自 回 归 模型 而 言 ， 该 想法 是 显而易见 的 、 这 里 ， 在 平稳 模型 中 引 人 一 个 可 能 


非 零 的 均值 w， 把 它 作为 另 一 个 需要 用 最 小 二 乘法 估计 的 参数 . 
自 回 归 模 型 
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Y, — p = $Y — pw +2, Tate ae 
我 们 可 将 其 看 成 是 以 Y,_| 为 预测 变量 ，Y, 为 啊 应 变量 的 回归 模型 . 最 小 二 乘 佑 计 是 通过 对 如 
下 差分 的 平方 和 的 最 小 化 来 进行 估计 的 : 
(Y, =g) — $(Y,, — yu) 
因为 只 有 YY: Y, 的 观测 值 ， 故 只 能 从 :一 2 到 tSn KA. > 


S. (fu) = 2 Y, —p) - HY 一 A) 了 (7. 2. 2) 


该 式 通常 称 为 条 件 平方 和 函数 . ( 称 为 条 件 的 理由 将 在 后 i 面 说 明 . ) 根据 最 小 二 乘 原 则 ， 给 定 观 
WAY: ,Y:,…,Y,， 可 用 使 得 S.(%，w) 最 小 化 的 参数 取 值 分 别 作为 上 和 A 的 估计 . 
由 方程 BGS-/ 3 一 0， 有 


= a ley, —p) —#(Y,, —p) J(—14+4) =0 
或 者 ， 简 化 并 求 y， 
ee eee n E n 
Eo man LY 2Y- | (7; 2.8) 
对 于 数值 较 大 的 n, 
DY ~ bY a Y 
因此 ， 无 论 #$ 取 何 值 ， WE (7. 2. 3) ve 
i (7-97) = 了 (7. 2. 4) 


iF 
再 对 % 最 小 化 S.(%，Y)， 有 


SAD L DAY -D -Yn -DY -Y 
令 上 式 等 于 零 ， 求解 乡 得 到 


5 (Y, —Y) (Y — Y) 
ĝ 一 t=2 
5 (Y,, — Y)? 


t2 


除了 分 母 中 少 一 项 ， 即 (Y, 一 了 )*， 该 式 与 n 相等 .对 平稳 过 程 来 说 ， 这 个 缺 项 是 可 以 忽略 
的 ， 因 此 最 小 二 乘 与 矩 估计 量 几 乎 相等 ， 特 别 是 对 大 样本 而 言 . 
得 到 方程 (7.2.3) 和 (7.2.4) 的 方法 极 易 推广 至 一 般 AR(p) 过 程 ， 并 有 相同 结果 ， 即 
a=Y- (7.2.5) 
考虑 二 阶 模型 以 得 到 $ 的 一 般 的 估计 .根据 方程 〈7. 2. 5) ， 在 条 件 平 方 和 函数 中 用 工 蔡 换 A， 
因此 有 
S.( 轴 ,加 ,Y) = SIY- — h (Ym — Y) 一 页 (Y Y) (7.2.6) 


t=3 


110 第 7 新 


令 aS, /9 办 =0, 有 
—2 Y, 一 7) 一 册 (Y — Y) — h (Y2 — Y) Y — Y) =0 (7. 2.7) 
t=3 
可 以 另 写成 


S, — Y) (Y. — Y) =( wear —Y)*)$, 
m S (7.2.8) 
十 SS) (Ya — YY —¥))¢, 
Te 


少 一 项 乘积 CY, —Y) CY, 一 


与 滞后 项 乘积 得 到 的 和 3 (Y, -DYP 非常 接近 的 分 子 
D. YY. -PY ,一 了 ) 的 情况 类 似 ， 但 这 里 缺 了 (Y, 一 了 了 ) (Y, ,一 了 )， 如 果 方 程 


(7.2.8) 两 边 同 时 除 以 2 ¥, — ¥) ， 则 除 平 稳 假 设 下 可 了 予以 忽略 的 边缘 效应 外 ， 得 到 
rn = f tnt (7.2.9) 
对 方程 9S./93$ 二 0， 类 似 的 近似 得 到 
rz = nti t+? (7. 2.10) 
而 方程 (7.2.9) 和 (7.2.10) 恰好 是 AR(2) 模型 的 样本 Yule-Walker 方程 . 
一 般 的 平稳 AR(p) 情况 下 ， 可 得 出 完全 类 似 的 结果 : JAIRE, $ 的 条 件 最 小 
二 乘 估计 可 以 通过 解 样本 Yule-Walker 方程 组 (7.13) 得 到 .S 
滑动 平均 模型 
现在 考虑 MA(1) 模型 中 0 的 最 小 二 乘 估 计 : 
Y, = e, — be, aii 
乍 看 之 下 ， 如 何在 这 类 模型 上 应 用 最 小 二 乘 或 回归 的 方法 并 不 是 显而易见 的 ， 但 是 ， 回 顾 方程 
(4.4.2), afi MAC) 模型 可 以 表示 为 
Y, 一 一 byY， — PY -2 — CY 一 … 十 e 
这 正 是 一 个 自 回归 模型 的 形式 ， 但 其 阶 数 是 无 穷 的 . 如此， 运用 最 小 二 乘法 就 顺理成章 了 ， 通 
过 选择 9 的 值 使 下 式 最 小 化 : 
S.(0) = > Ce)? = DULY, +H m + PY t Ynt (7. 2. 12) 
其 中 隐 示 了 oe, =e,(0) 是 观测 序列 和 未 知 参 数 0 的 函数 . 
从 方程 (7.2.12) 显然 可 以 看 出 ， 最 小 二 乘 问题 关于 参数 是 非 线性 的 .无 法 通过 对 0 求 导 
数 令 其 等 于 零 并 求解 来 得 出 S.(9) 的 最 小 值 . 因此 ， 即 使 对 简单 的 MA(1) 模型 ， 也 需求 助 于 
数值 优化 技术 . 这 里 还 有 别 的 问题 : 既 没 有 证 明 方 程 (7. 2. 12) 中 求 和 项 具有 明确 的 极限 ， 也 
未 说 明 如 何 处 理 求 和 符号 下 的 无 穷 级 数 . 


© 注意 Lai 和 Wei(1983) GEM, BU MERA Yule-Walker 方程 的 非 平稳 自 回归 模型 ， 条 件 最 小 二 乘 估 计 仍 然 是 一 
致 的 . 
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为 解决 上 述 问 题 ， 考 虑 给 定 一 个 单独 的 0 值 来 对 S.C90) 进行 评估 .这 里 观测 序列 YY. oe, 
Y, 是 唯一 可 用 的 Y.， 把 方程 (7. 2. 11) 重 写 为 
e =Y, +e, (7. 2. 13) 
利用 该 方程 ， 如 果 已 知 初始 值 eo。 ， 则 可 以 递 推 计 算 ej ,es ,…,e,， 常用 的 近似 法 是 令 e = 0— 
其 期 望 值 . 则 在 e =O 的 条 件 下 ， 可 得 


el =Y, 

e = Y, + de, 

Es = Y, + de, (7.2. 14) 
e, = Y, +e, 


这 样 就 对 这 个 给 定 的 8 值 ， 以 eo =0 为 条 件 ， 计 算 了 S.(6) = Dd) Ce)’. 
在 只 有 一 个 参数 的 简单 情形 ， 可 在 8 的 可 道 域 (一 1， 十 1) 上 进行 网 格式 搜索 ， 来 求 得 平 
方 和 的 最 小 值 ， 对 于 更 一 般 的 MA (g) 模型 ， 则 需要 应 用 诸如 Gauss-Newton 或 者 Nelder- 
Mead 等 数值 优化 算法 . 
对 高 阶 滑动 平均 模型 ， 思 路 类 似 ， 也 不 会 碰 到 新 的 困难 . 自 下 式 迭 代 计 算 ee, C bt): 
e = Y, Fhe Fire + “r F Oue (7.2.15) 
Hp esen = =e, =0. HHETRABK, TARA... 0, 联合 地 求 取 平 方 和 的 最 
小 值 . 
混合 模型 
考虑 ARMAC, 1) 的 情况 
Y, = $Y +e, — Gen, (7. 2. 16) 
(Rati MA 情况 一 样 ， 考 虑 we =e (4, 0, HW BESO = Sled 最 小 化 ， 可 把 方程 
(7.2.16) 重新 与 成 
e = Y, — $Y 1 十 be， (7.2.17) 
为 求 得 e:， 这 里 有 个 额外 的 “启动 ”问题 ， 即 Y， 一 种 方法 是 当 模型 包含 非 零 均 值 时 ， 令 
Y, =O 或 等 于 了 ,但 还 有 一 个 更 好 的 方法 ， 即 从 :一 2 开始 递 推 ， 从 而 完全 避 开 了 Yo REM 
单 地 最 小 化 
S.($,0) = ye 
对 一 般 的 ARMA(p, g) 模型 ， 计 算 
e = Y, — h Ye — be Yee 一 光一 网 Y thier F Oreg + + Ger, (7.2. 18) 
其 中 ee, SH Hyg = Oy 然后 用 数值 算法 最 小 化 S.A, Bott By Ai Oe ee Gy)» FEB 
所 有 参数 的 条 件 最 小 二 乘 估 计 . 
对 大 样本 而 言 ， 初 始 值 e, ;e,_1，… repr ,的 选取 对 于 可 道 模型 相应 参数 集 0 ,60,,… ,0 的 最 
终 佑 计 影 响 甚 微 ， 
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7.3 极 大 似 然 与 无 条 件 最 小 二 乘 


对 于 长 度 适中 的 序列 以 及 将 在 第 10 章 讨 论 的 随机 季节 模型 来 说 ， 初 始 值 e, =e, = = 
est1-g 一 0 会 比较 显著 地 影响 参数 的 最 终 估 计 ， 从 而 引发 对 更 困难 的 极 大 似 然 估 计 问 题 的 探讨 . 

不 同 于 最 小 二 乘 仪 利用 了 一 阶 和 二 阶 和 矩 ， 极 大 似 然 估计 法 的 优势 在 于 利用 了 数据 包 会 的 所 
有 信息 . 还 有 一 个 优势 是 ， 可 在 非常 一 般 的 条 件 下 得 出 许多 大 样本 结论 ， 它 的 一 个 劣势 是 ， 第 
一 次 不 得 不 具体 运用 过 程 的 联合 概率 密度 函数 . 

极 大 似 然 估 计 

对 任意 观测 集 Yi ,Y,,…,Y,， 无 论 是 否 是 时 间 序 列 ， 似 然 函 数 L 均 定义 为 获取 实际 观测 数 
据 的 联合 概率 密度 函数 . 但 其 亦 被 看 做 是 当 观 测 数 据 固 定时 模型 中 各 未 知 参 数 的 函数 ， 对 
ARIMA 模型 ， 给 定 观 测 值 了,Y,,…,Y,， 工 是 各 加、 各 6、 Mo? 的 函数 .使 得 实际 观测 数据 
可 能 性 最 大 的 参数 取 值 ， 也 即 最 大 化 似 然 函数 的 参数 取 值 ， 就 定义 为 极 大 似 然 估 计量 . 

我 们 从 ARO) 模型 的 详细 研究 开始 ， 最 常用 的 假设 是 各 白 噪 声 项 为 相互 独立 ， 服 从 正 态 
分 布 的 随机 变量 ， 具 有 零 均 值 和 相同 的 标准 差 o MA e 的 概率 密度 丽 数 (pdf) 是 


2 
(2xo:) “exp( 一 a) ， —o coe <0 
且 由 独立 性 ， 得 到 Ea rE sb, 的 联合 pdf 是 


(roi) "nexp(— sty De!) (7. 3. 1) 


现在 考虑 
Y:— p = ¢(Y, — u) + e 
a a i oa | (7.3.2) 
Yna — u = AY mi ITa] 
如 果 以 Yi =y1 为 条 件 ， 则 方程 (7. 3. 2) 定义 了 了 一 个 Ea Ëg a T" s En 与 Y: la sl 之 间 的 线性 
变换 (其 Jacobian 等 于 1). 因此 给 定 Y= 二 yy， 利 用 方程 (7. 3. 2)， 通 过 在 方程 (7.3.1 中 用 
Y 替换 e HH YYY, 的 联合 pdf 得 到 
fy: sYa Vn |y1) 
Pre. 3) 
= (2r) A x exp |— zz DL — — $y — pT 
现在 考虑 Yi 的 (边际 ) 447. AARO) 过 程 的 线性 过 程 表 达 式 (方程 (4. 3. 8)) 可 以 得 出 ， 
Y 服从 均值 为 wp FHA G/A-#*) 的 正 态 分 布 ， 把 方程 (7. 3.3) 的 条 件 pdf 与 Y 的 边际 
Wo, u Alo? 的 函数 ， 给 出 如 下 ， 
Lsp) = (2n0!) 81 —$) exp| — 7S ($sp) | (7. 3. 4) 


其 中 


A AH 113 


So) = DY, = — $Y — w+ a-— #9, —p) (hA 
1 王 2 


图 数 S(t，py)》 称 为 无 条 件 平方 和 函数 . 
一 般 而 言 ， 似 然 函数 的 对 数 比 其 本 身 更 便于 处 理 . 对 AR(1) ATO, WRB, ic 
为 El, us ods A FAH H: 


Cb, prot) =— Alg — Blog(o?) + +logQ2— #2) -—=LSGu) (7.3.6) 
2 2 2 2a: 


ee Aly WA, Ce ws of) 可 以 通过 待定 的 估计 量 上 和 jy 解析 地 求 其 关于 ot 的 最 大 
值 ， 得 a 到 


g = SLA (7. 3.7) 


” 

和 许多 其 他 类 似 的 情况 一 样 ， 为 得 到 无 偏 估 计量 通常 除 以 n 2 而 不 是 n( 因 为 所 估计 的 是 两 个 
BRO AM ye). 对 典型 的 时 间 序 列 样本 量 来 说 ， 这 样 做 的 差别 不 大 . 

现在 考虑 上 和 A 的 估计 .比较 无 条 件 平方 和 函数 SCH, pw) 与 方程 〈7. 2.2) 的 条 件 平方 和 
函数 S.C($，)， 可 发 现 如 下 简单 的 差别 ， 

Syn) = S$.) +O PY op) (7. 3. 8) 

A Sh, 2) 包括 n 一 1 项 的 和 ， 而 A-# (Yi: 一 /2 RE n, HUA SH, WXS.(d wd. 
因此 ， 使 得 S($，) 或 S.($，) 最 小 化 的 5 和 jx 的 值 应 该 非常 接近 ， 至 少 在 大 样本 的 情况 下 
如 此 .， 当 取得 最 小 值 时 ，$% 恰 在 平稳 边界 士 1 的 附近 ， 这 种 情况 下 方程 (7. 3. 8) 最 右边 项 的 效 
果 将 更 可 观 ， 

无 条 件 最 小 二 乘 

如 果 在 条 件 最 小 二 乘 估 计 与 完全 极 大 似 然 佑 计 之 间 做 个 折 中 的 话 ， 可 以 考虑 寻求 无 条 件 最 
小 二 乘 估 计 ;， 即 通过 最 小 化 S, w 来 得 到 估计 .遗憾 的 是 ， (一 玫 ) (Yl 一 jp)* 项 使 得 方程 
3S/ag 一 0 和 3S/an=0 关于 #$ 和 jp 是 非 线 性 的 ， 而 重新 参数 化 到 一 个 常数 项 抽 二 py(1 一 和 也 无 
助 于 状况 的 根本 改善 ， 因 此 最 小 化 必须 通过 数值 化 方式 进行 ， 所 得 的 估计 称 为 无 条 件 最 小 二 乘 
估计 . 

对 于 更 一 般 的 ARMA 模型 ， 其 似 然 函 数 的 推导 非常 繁琐 ， 附 录 H 示 出 了 一 个 推导 过 程 ; 
状态 空间 模型 .建议 读者 参考 Brockwell 和 Davis(1991) 或 者 Shumway 和 Stoffer(2006) 以 了 
解 更 多 的 细节 . 


7.4 估计 的 性 质 
PAU ARN AEREA 估计 量 的 大 样本 性 质 相 同 ， 可 通过 对 标准 的 极 大 似 
然 理论 进行 适当 修正 而 得 到 ， 详 见 Shumway 和 Stoffer(2006, 125—129 页 )， 下 面 针 对 简单 的 
ARMA 模型 看 看 相关 的 结果 及 其 会 义 ， 
当 n 较 大 时 ， 估 计量 近似 无 偏 且 服 从 正 态 分 布 ， 方 差 与 相关 系数 如 下 : 
AR(1) :Var( 有 = Le D 1) 


o g 
vadis Vans i 
AR(2)， (7. 4. 2) 
Corr(¢, „$, ) = rs =— M 
MA(1):Var(§) = -一 人 (7. 4.3) 
Var(@,) a Varlĝ,) 2 1~ 6 
fi 
MA(2). , (7. 4. 4) 
Corr( ĝ, Oo) A i-a 
o [larl — $07" 
Varp ~ [1E 


] 一 2 
=a (7. 4.5) 


ARMA(1.1) :1 Var(@) ~ ee 
Va—-#)0—6@) 
1 — $0 

注意 ， 对 于 AR(1)， 当 # 趋 于 士 1 时 ， 其 全 计量 的 方差 随 之 变 小 ， 同 时 应 注意 到 ， 即 使 
AR(1) 模型 是 AR(2) 模型 的 特例 ， 方程 (7. 4. 2) 所 示 的 名 的 方差 表明 ， 如 果 我 们 错误 地 用 
AR(2) 模 型 进行 拟 合 ， 则 对 页 的 估计 一 般 而 言 会 有 所 损伤 ， 因 为 事实 上 ， 各 二 0。 当 MACO) 
足以 拟 合 却 选 用 MAO) 模型 ， 以 及 当 AR(1) RMAC) 足以 拟 合 而 选择 ARMAC, 1) 模 
型 时 ， 可 以 得 出 类 似 的 结论 . 

对 ARMAC, 1) 的 情况 ， 应 注意 方程 (7. 4.5) 中 方差 表达 式 的 分 母 是 $8 一 9， 当 5 和 0 
相差 无 几时 ,和 8 之 估计 量 的 可 变性 会 非常 大 . 

注意 在 所 有 的 双 参 数 模型 中 ， 估 计量 间 的 相关 度 很 高 ， 即 便 样本 量 极 大 时 亦 然 . 

针对 的 若干 取 值 和 不 同 的 样本 量 ， 图 表 7-2 列 出 了 在 对 ARO) 模型 中 由 进行 估计 时 ， 
估计 量 之 标准 差 的 大 样本 允 近 的 数值 ， 因 为 表 中 的 值 都 等 于 Vl 一 上 下)/n， 所 以 根据 方程 
(7.4.2), (7.4.3) 和 (7. 4. 4)， 在 用 这 些 值 计算 标 准 差 时 ， 效 果 同 样 地 好 . 

因此 ， 在 估计 ARC 模型 的 时 候 ， 例 如 在 n= 二 100， #8 二 0.7 时 ， 可 以 确信 在 95% 的 水 平 
E. 引 的 估计 误差 不 超过 士 2(0, 07) = £0. 14, 

至 少 在 大 样本 情况 下 ， 对 于 平稳 自 回归 模型 而 言 ， 通 过 和 矩 估 计 、 基 小 二 到 和 极 大 似 然 所 得 
到 的 估计 量 相等 ， 但 对 包含 滑动 平均 项 的 模型 则 不 然 ， 对 于 MAO) 模型 ， 可 以 证 明史 的 和 矩 怖 
计量 的 大 样本 方差 等 于 


Corr($,9) = 


EN +49¢ +6 +6 

Lto ee ee (7. 4, 6) 
比较 方程 (7. 4. 6) 与 方程 (7. 4. 3) ， 可 以 看 出 矩 估 计 所 得 估计 量 的 方差 总 是 比 极 大 似 然 佑 计 
RAK. 图表 7-3 列 出 了 对 于 9 的 若干 取 值 下 两 种 方法 所 得 大 样本 标准 差 的 不 同比 率 . 例如 ， 
若 等 于 0.5， 则 通过 矩 估计 得 出 的 估计 量 ， 其 大 样本 标准 差 要 比 使 用 极 大 似 然 法 所 得 到 的 大 
42 吕 ， 由 此 可 见 ， 和 些 方 法 的 估计 量 不 宜 用 在 MAG) 模型 上 ， 同 理 也 不 建议 将 之 用 于 所 有 包含 


滑动 平均 项 的 模型 . 


Var(@) = 
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图 表 7-2 AR(1) 模型 $ 的 图 表 7-3 MA(1) 模型 中 的 和 矩 估 计 (MM) 
大 样本 标准 差 与 极 大 似 然 估 计 (MLE) 
8 SDum/SDuie 
0,25 1. 07 
0. 50 1. 42 
0.75 2. 66 
0. 90 5. 33 


7.5 参数 估计 例证 


考虑 模拟 MA(1) 序列 ， 其 中 9 一 一 0.9， 该 序列 见 图 表 4-2， 可 以 看 出 9 的 矩 估计 值 相当 
差 ， 是 一 0.554; WAZ 7-1. 与 之 相对 ， 极 大 似 然 估计 值 是 一 0.915， 无 条 件 平方 和 估计 值 是 
一 0.923， 条 件 最 小 二 乘 估计 值 是 一 0. 879， 就 该 序列 而 言 ， 极 大 似 然 估 计 值 一 0. 915 最 接近 模 
拟 所 用 的 真实 值 ， 使 用 方程 〈7. 4. 3) ， 以 估计 值 蔡 换 9， 得 到 标准 误差 约 为 


—_ ĝè a 2 
SWath) xs /一 = /一 人 ~ 0. 04 


因此 极 大 似 然 、 条 件 平方 和 或 无 条 件 平 方 和 得 出 的 估计 ， 都 没有 显著 偏离 真实 值 一 0. 9. 
第 二 个 6 一 0. 9 的 模拟 MA(1)， 所 得 矩 估计 值 为 0.719， 见 图 表 7-1， 条 件 平方 和 估计 值 为 
0. 958， 无 条 件 平方 和 估计 值 是 0.983， 极 大 似 然 估 计 值 是 1.000. 和 上 例 类 似 ， 这 些 估计 的 标 
准 误差 都 约 为 0.04， 此 处 的 极 大 似 然 估 计 值 81 令 人 上 略 感 困惑 ， 因 其 对 应 的 模型 不 可 逆 . 
第 三 个 9 二 一 0.3 的 模拟 MA(1)， 所 得 和 矩 估 计 值 为 一 0.719 (RAR 7-1)， 极 大 似 然 估 计 
值 是 一 0. 894， 相 应 的 标准 误差 约 为 
Vat ~ HOBO 0.06 
对 这 些 数据 所 得 条 件 平方 和 估计 值 是 一 0. 979， 无 条 件 平 方 和 估计 值 是 一 0.961. 当然 ， 标 准 误 
差 这 么 小 ， 根 本 无 需 记 录 9 估计 值 小 数 点 后 超过 十 位 的 数字 . 
模拟 自 回 归 模 型 的 结果 汇总 在 图 表 7-4 和 图 表 7-5 中 ， 
图 表 7-4 ”模拟 AR(1) 模型 的 参数 估计 


参数 ¢ E titt 条 件 SS 估计 无 条 件 SS 估计 极 大 似 然 估 计 n 
0.9 0. 831 0. 857 0.91] 0. 892 60 
0.4 0. 470 0. 473 0. 473 0. 465 60 

> data(arl.s); data(arl.2.s) 

> ar(arl.s,order.max=1,AIC=F,method='yw' ) 

> ar(arl.s,order.max=1,AIC=F,method='ols' } 

> ar(arl.s,order.max=1,AIC=F,method='mle') 

> ar(arl.2.s,order.max=1,AIC=F,method='yw') 

> ar(arl.2.s,order.max=1,AIC=F,method='ols') 

> ar(arl.2.s,order.max=1,AIC=F,method='mle') 


由 方程 〈7. 4. 1) ， 估 计 的 标准 误差 分 别 是 


A 1—¢ _ /1—(0. 831)? _ 
VVaf($) ~ 一 一 这 æ 0.07 
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a. 门 一 (0.470)5 
JVai$) = ,/-— æ 0.11 


鉴于 标准 误差 很 小 ， 所 有 四 种 估计 方法 应 用 于 ARGO) 模型 时 都 显示 了 很 好 的 合理 性 ， 
图 表 7-5 模拟 AR{2) 模型 的 参数 估计 


SS 估计 SS 估计 fait 
@=1.5 l. 472 1. 5137 1.5183 1. 5061 120 
f = — Ü. 75 — 0. 767 — ü. 8050 — ü. 8093 — 0. 7965 120 


data {ar2.s) 

ar (ar2.s,order.max=2,AIC=F,method='yw') 
ar (ar2.s,order.max=2,AIC=F,method='ols') 
ar (ar2.s,order.max=2,AIC=F,method='mie') 


Vv V wW wW 


由 方程 〈7.4.2)， 估 计 的 标准 误差 是 


— ae 2 
/VatG,) ~ /Vaile,) ~ jp — 一 二 一 ~ 0. 06 


同样 ， 因 为 标准 误差 很 小 ， 所 有 四 种 方法 应 用 于 AR(2) 模型 时 都 有 很 好 的 合理 性 . 
作为 应 用 模拟 数据 的 最 后 示例 ， 考 虑 图 表 6-14 所 示 的 ARMA(1，1)， 其 中 g 一 0.6，b 一 一 0. 3， 
?一 100， 用 各 种 方法 所 得 估计 结果 见 图 表 7-6. 


图 表 7-6 模拟 ARMA(1, 1) 模型 的 参数 估计 


SH iiH 条 件 无 条 件 极 大 偶然 n 
SS 估计 SS 估计 估计 

# 一 0.6 0. 637 0. 5586 0. 5691 0. 5647 100 

8 一 一 0. 3 一 0. 2066 一 0. 3669 一 0. 3618 —0. 3557 100 


data (armall.s)} 
arima(armall.s, order=c(1,0,1),method='Css')} 
arima(armall.s, order=c(1,0,1),method='ML') 


YYW] 


F 面 看 看 真实 的 时 间 序 列 ， 先 看 看 首 见于 图 表 1-3 的 化 工 属性 时 间 序 列 . 根据 图 表 6-26 所 
示 的 样本 PACF， 宜 对 该 序列 建立 ARC) 模型 ， 图表 7-7 显示 了 使 用 四 种 估计 方法 得 到 的 对 


BHR WA HIME. 
AR7-7 颜色 属性 序列 的 参数 信 计 


参数 矩 估计 条 件 无 条 件 极 大 似 然 3 
SS ffit SS 估计 估计 
$ 0. 5282 0. 5549 0. 5890 0. 5703 35 


> data (color) 

> ar (color, order .max=1,AIC=F,method='yw') 
> ar{color,order.max=1,AIC=F,method='ols') 
> ar (color, order.max=1,AIC=F,method='mle') 


这 里 估计 量 的 标准 误差 约 为 
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fVatta) #2 ee we 0.14 
因此 所 有 和 估计 不 相 上 下 . 


作为 第 二 个 例子 ， 再 来 考察 加 拿 大 野兔 丰 度 序列 ， 如 前 基于 原始 直上 度数 据 的 平方 根 建 模 . 
基于 图 表 6-29 所 示 的 偏 自 相 关 函 数 来 估计 AR(3) MB. AMARA. AR 软件 得 
到 的 结果 示 于 图 表 7-8 F. 


图 表 7-8 R 软件 极 大 似 然 估计 : 野兔 丰 度 序列 


系数 arl ar2 ar3 ag pA © 
1.0519 — 0, 2292 — ğ. 3931 5. 6923 
ü. 1877 0. 2942 0.1915 0. 3371 


o 估计 值 为 1.066， 对 数 似 热 值 = 一 46. 54，AlC==101. 08 
中 这 里 的 截 距 项 估计 的 是 过 程 的 均值 pg 而 不 是 Go. 


> data (hare) 
> arima(sqrt (hare) ,order=c(3,0,0)) 


x Hg, =1.0519, ¢,=—0. 2292, ¢,=—0. 3930, FATWA FS H AE = 1.066. EAER 
差 ， 与 截 距 项 -一样 ， 自 回归 系数 的 1 阶 和 3 阶 滞后 估计 明显 异 于 零 ， 而 其 2 阶 澡 后 估计 则 不 是 
那么 显著 . 
估计 模型 可 写 为 
JY, — 5. 6923 =1.0519( YY, — 5. 6923) — 0. 2292( /Y,-. 一 5. 6923) 
— 0. 3930(./Y,3 — 5. 6923) +e, 
或 
JY, = 3.25 +1. 0519 yY, — 0. 2292 /¥,2 — 0.3930 VY +e, 
其 中 Y 表示 第 上 年 野 锡 丰 度 的 原始 数据 ， 因 为 2 阶 滞后 自 回归 项 不 显著 ， 故 可 去 掉 该 项 〈 即 
令 页 =0)， 然 后 利用 该 子 模型 获得 贞 Ad, 的 新 估计 . 
作为 最 后 一 个 例子 ， 回 到 石油 价格 序列 ， 图表 6-32 所 示 的 样本 ACF 表明 可 对 价格 的 对 
数 差 分 建立 MAC) 模型 ， 图 表 7-9 列 出 了 使 用 不 同方 法 所 得 9 的 估计 值 ， 如 前 所 见 ， 甜 估 
计 的 结果 与 其 他 方法 差别 较 大 ， 鉴 于 标准 误差 约 为 0.07， 因 此 可 以 说 其 他 方法 几乎 是 等 
同 的 ， 
图 表 7-9 石油 价格 对 数 差分 序列 的 估计 


参数 E fitt RIF 无 条 件 RAE n 
35 44h SS fit {atl 
o 9 — 0. 2225 0, 2731 一 0. 2954 一 0. 2956 241 


> data(oil.price) 

> arima(log(oil.price) ,order=c(0,1,1),method='css') 

> arima(log(oil.price) ,order=c(0,1,1) ,method='ML') 
owes eee 
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7.6 自助 法 估计 ARIMA 模型 


在 7.4 节 ， 针 对 估计 量 纪 经 总 结 了 一 些 近似 正 态 分 布 的 结果 ， 其 中 y 是 包含 ARMA 所 有 
参数 的 向 量 . 在 大 样本 情况 下 ， 这 些 正 态 近 似 是 精 确 的 ， 并 且 统 计 软 件 一 般 都 利用 这 些 结论 计 
算 和 报告 标准 误差 . 若 存 在 的 话 ， 通 常用 delta 方法 求 得 基于 模型 参数 的 某 些 复杂 函数 的 标准 
误差 ， 例 如 模型 的 准 周期 . 但 在 实践 中 到 底 样本 规模 要 多 大 用 正 态 近似 才 可 靠 ， 一 般 的 理论 没 
有 提供 相关 指引 ， 自 助 法 (Efron 和 Tibshirani, 1993; Davison 和 Hinkley, 2003) 在 评价 佑 
计量 不 确定 性 时 另辟蹊径 ， 对 小 样本 情况 可 能 更 为 精确 .对 因 变 量 的 自助 算法 有 若干 变种 一 一 
W, Politis (2003)， 这 里 的 讨论 局 限 在 参数 化 自助 法 上 ， 即 由 拟 合 的 ARIMA(p, d, q) 模型 
模拟 生成 自助 时 间 序 列 YY Y? a Ye. (对 于 观测 数据 ， 可 以 固定 前 p td 个 Y* 的 初始 值 来 
施行 自助 法 .对 平稳 模型 还 有 一 种 方法 ， 即 由 拟 合 模 型 来 模拟 平稳 实现 ， 大 致 的 做 法 是 用 拟 合 
模型 来 模拟 一 个 较 长 的 时 间 序 列 ， 然 后 将 模拟 数据 的 瞬 态 初始 部 分 截 去 即 所 谓 的 预 烧 ). 
若 假 定 误 差 服 从 正 态 分 布 ， 则 可 从 NCO, of) 中 用 可 放 回 随机 抽样 方法 对 误差 抽样 . 若 误 差分 
布 未 知 ， 则 可 从 拟 合 模 型 的 残 差 中 用 可 放 回 随机 抽样 方法 对 误差 抽样 。 对 每 个 自助 序列 ， 在 平 
稳 假 设 下 ， 今 了" 为 基于 自助 时 间 序 列 数据 用 极 大 似 然 估计 计算 出 的 估计 值 . 〈 也 可 以 使 用 其 他 
的 估计 方法 . ) 重复 使 用 自助 法 ， 比 如 说 B 次 . (例如 B=1000.) 由 这 B 个 自助 法 估计 值 ， 可 
构造 一 个 经 验 分布 ， 并 用 它 来 校准 ?的 不 确定 程度 . 假设 想 估 计 y 的 某 个 琐 数 ， 比 如 说 
h(7Y) 一 一 AR(1) 模 型 的 系数 . 使 用 分 位 数 法 ， 可 以 从 ACY) 自助 分 布 的 2.5 百 分 位 数 至 97. 5 
百 分 位 数 这 一 区 间 ， 得 出 h(yY)95% 的 自助 置信 区 间 . 

下 面 使 用 野 免 数据 对 自助 法 做 进一步 的 例 解 . 以 最 初 三 个 观测 为 条 件 ， 并 假设 误差 服从 正 
态 分 布 ， 在 这 些 前 提 下 应 用 自助 法 ， 所 得 95%% 自 助 置 信 区 间 见 图 表 7-10 的 第 一 行 . 第 二 行 是 
应 用 相同 方法 得 到 的 ， 不 同 之 处 在 于 误差 项 得 目 残 差 抽样 . 第 三 、 四 行 给 出 基于 平稳 目 助 法 的 
置信 区 间 ， 第 三 行 中 使 用 的 是 正 态 分 布 的 误差 ， 而 第 四 行使 用 的 是 满足 经 验 残 差分 布 的 误差 . 
表 中 第 五 行 所 示 的 理论 上 的 95 和 置信 区 间 是 基于 估计 量 的 大 样本 分 布 结果 得 到 的 ， 特别 地 ， 
第 一 种 自助 法 得 出 的 自助 时 间 序 列 是 由 下 述 方程 递 推 产生 : 

Y; — $ Yii — Yi — hY 一 六 十 er 7.6.1) 
t=4,5,°%,31, 其 中 er 独立 地 得 自 N(0, a), Yr =Y,» Yz: =Y,, Ys =Y}; 各 参数 设 定 为 拟 
合 〈 经 开 方 变换 后 的 ) 野兔 数据 的 AR(3) 模型 的 估计 值 ， 其 中 负 三 上 (1 一 页 一 宙 一 让) 经 约 
1000 次 重复 使 用 自助 法 得 到 所 有 结果 ， 但 对 工 、 开 、 严 和 KK 四 种 自助 法 ，1000 次 之 中 完全 极 
大 似 然 估 计 的 失效 率 分别 为 6. 3%，6. 3%，3.8% 和 4.8%. 


图 表 7-10 拟 合 野兔 数 据 的 AR(3) 模型 ， 其 自助 法 和 理论 的 置信 区 间 


方法 arl ar2 ar3 截 距 噪声 方差 
I (0.593, 1.269) (—0.655, 0.237) (—0. 666, —0. 018) (5.115, 6.394) (0.551, 1.546) 
[I (0.612, 1.296) (一 0. 702，0. 243) (—0. 669, —0. 026) (5.004, 6.324) (0.510, 1.510) 
fl (0.699. 1.369) (一 0. 746, 0.195) (—0. 666. —0. 021) (5.056, 6.379) (0.499, 1.515) 
lV (0.674, 1.389) (-—0.769, 0.194) (—0. 665, — 0. 002) (4.995, 6.312) (0.477, 1.530) 


理论 上 的 (0. 684，1. 42) ¢(—0.8058. 0.3474) (—0.7684,. —0.01776) (5.032, 6.353) (0.536, 1.597) 


> See the Chapter 7 R scripts file for the extensive code 
required to generate these results. 
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虽然 一 般 而 言 ， 条 件 自助 法 得 到 的 置信 区 间 较 罕 ， 但 上 述 四 种 方法 所 得 的 自助 置信 区 间 却 是 基 
本 近似 的 .这 点 未 出 所 料 ， 因 为 所 有 序列 满足 相同 的 初始 条 件 ， 故 各 条 件 自助 时 间 序 列 间 的 相似 度 
更 大 ， 一 般 地 ， 与 得 自 大 样本 结果 的 理论 置信 区 间 相 比 ， 目 助 置 信 区 间 要 稍 徽 宽 一 些 ， 总 的 推断 绪 
论 是 ， 系 数 加 的 估计 量 不 显著 ， 而 系数 由 和 上 只 的 估计 量 都 在 5% 显 著 水 平 上 显著 . 

某 些 模型 特征 是 模型 参数 的 非 线 性 函数 ， 在 其 置信 区 间 的 简便 构造 方面 自助 法 具有 优势 . 例 
如 ， 拟 合 墅 免 数 据 的 ARG) MA, 其 AR 特征 多 项 式 有 一 对 复数 根 ， 实 际 上 所 有 的 根 是 0.84 士 
0. 647i 和 一 2. 26， 其 中 i= v 一 1， 而 两 个 复数 根 也 可 写成 极 坐 标的 形式 : 1.06exp( 士 0.657i)， 如 同 
54 页 上 对 AR(2) 模型 准 周 期 的 讨论 一 样 ， 拟 合 的 AR(3) 模型 的 准 周 朝 可 定义 为 2r/0. 657 王 9. 57, 
因而 拟 合 模型 说 明了 野兔 丰 度 以 约 9. 57 年 的 周期 循环 波动 . 构造 准 周期 95%% 置 信 区 间 这 一 有 趣 的 问 
题 可 以 用 delta 法 加 以 研究 ， 但 由 于 准 周 期 是 参数 的 复杂 函数 ， 该 方法 将 会 非常 复杂 ， 而 自助 法 给 出 
一 种 简单 的 解决 方案 ， 针 对 每 组 自助 参数 估计 值 ， 可 以 计算 准 周 期 并 进而 得 出 其 目 助 分 布 ， 可 用 分 
位 数 法 构造 准 周期 的 置信 区 间 ， 并 可 用 自助 准 周期 估计 的 直方 图 来 研究 分 布 的 形状 . (注意 当 AR ff 
征 方程 的 根 都 为 实数 时 ， 准 周期 无 法 定义 . ) 对 于 误差 项 得 自残 差 中 可 放 回 随机 抽样 的 拟 合 模型 ， 在 
对 其 模拟 所 得 到 的 1000 个 平稳 自助 时 间 序 列 中 ， 有 952 个 序列 可 以 得 到 很 好 的 完全 极 大 似 然 全 
计 ， 其 中 除 一 个 以 外 都 有 定义 明确 的 准 周期 ， 它 们 的 直方 图 见 图 表 7-1. 该 直方 图 显示 ， 淮 周期 
估计 的 样本 分 布 略 向 右 偏 .8 正 态 QQ 图 (图 表 7-12) 更 进一步 表明 了 淮 周 期 估计 量具 有 厚 尾 分 
布 ， 因 此， 在 对 准 周期 佑 计量 的 样本 分 布 作 通 近 时 ，delta 法 和 相应 的 正 态 分 布 逼 近 可 能 并 不 适用 . 
最 后 ， 使 用 百 分 位 法 得 到 准 周期 的 一 个 95% BA [ade (7. 84，11. 34). 


图 表 7-11 准 周期 估计 的 自助 法 直方 图 


0.5 

0.4 
sg 03 
ya 

0.2 

0.1 

0.0 

一 TI a aaa 
6 8 10 12 14 
准 周期 


> win.graph (width=3.9,height=3.8,pointsize=8) 

> hist (period.replace, prob=T,xlab='Quasi-period',axes=F, 
xlim=c (5,16) ) 

> axis(2); axis(1,c(4,6,8,10,12,14,16),c(4,6,8,10,12,14,NA) ) 


A 


O Rit, RFE 035.9 后 的 讨论 ， 从 频 域 角度 看 ， 对 应 复数 根 存 在 一 个 很 小 的 参数 区 域 ， 相 应 的 准 周期 可 能 没有 实在 
的 物理 意义 这 正 表 明了 淮 周 期 这 一 慨 念 的 精巧 所 在 . 
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图 表 7-12 准 周 期 估计 自助 法 正 态 QQ 


-3 -2 -l 0 1 2 3 
理论 分 位 数 


> win.graph (width=2.5,height=2.5,pointsize=8) 
> qqnorm(period.replace); qqline(period.replace) 


7.7 小结 


KARARRI ARIMA 模型 的 参数 估计 问题 ， 分 别 介绍 了 基于 撼 方 法 、 各 类 最 小 二 乘 和 极 大 
化 似 然 函数 的 估计 准则 ， 并 且 给 出 了 各 种 估计 量 的 性 质 ， 还 结合 模拟 及 真实 时 间 序 列 数 据 加 以 例 解 . 
另外 ， 还 探讨 并 例 解 了 应 用 自助 法 于 ARIMA 模型 的 问题 . 


习题 


7.1 使 用 长 度 为 100 APS, RTA r =0.8, r2=0.5, 77=0.4, Y=2 及 样本 方差 5， 假 设 
一 个 带 常 数 项 的 AR(2) 模型 是 适当 的 模型 ， 那 么 如 何 (简单 ) fit dé, be. th» of? 

7.2 假设 下 列 数据 得 自 某 平稳 过 程 ， 计 算 yx，7X,，p WRIT: 6，5，4，6，4. 

7.3 如果 {Y WE ARG) 模型 ， 其 中 多大 约 是 0.7， 那 么 要 满足 估计 误差 不 超过 士 0.1， 在 95% 
置信 水 平 下 需要 多 长 的 序列 来 估计 =o? 

7.4 考虑 已 知 均值 是 零 的 MA(G1) 过 程 . 基于 一 个 长 度 n=3 的 序列 ， 观 测 到 Y 二 0，Y; = 
—1, Y;=1/2. 
Ca) 证 明 ; 6 的 条 件 最 小 二 乘 估计 值 是 1/2. 
(b) 求 噪声 方差 的 估计 ， (提示 : 此 简单 情形 无 需 使 用 和 迭代 算法 . ) 

7.5 对 给 定数 据 Y,=10，Y: 王 9，Y: 王 9.5， 拟 合 一 个 无 常数 项 的 IMAC, 1) 模型 . 
(a) 求 9 的 条 件 最 小 二 乘 估 计 值 ，( 提 示 : 先 做 习题 7. 4. ) 
(b) fitt ot. 

7.6 对 均值 非 零 的 AR(1) 过 程 ， 考 虑 两 种 不 同 的 参数 化 方式 : 
模型 .YY, 一 jy 二 $$ (了 -一 Ap) +e, 
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7.7 
7.8 


7.9 


RH I.Y, = Y,-1 H +e, 

LY ARE, RUA R DORA 6 Mp RAS AG. 证 明 : 模型 工 需 要 求解 非 线性 

方程 以 求 得 估计 ， 而 用 模型 开 则 只 需求 解 线 性 方程 ， 

证 明 方 程 (7. 1. 4) 成 立 . 

考虑 ARMA(1，1) 模型 ， 其 中 $=0. 5, 0=0. 45. 

(a) Xf n=48, ARE (7.4.5) SAO 的 极 大 似 然 估计 量 的 方差 和 相关 系数 进行 评估 ， 
并 解释 结果 . 

(b) X} n=120, BM (a)， 并 解释 这 次 的 结果 . 

模拟 一 个 8 二 0.8, n=48 的 MAC) 序列 . 

(a) 求 86 的 矩 佑 计 . 

(b) 求 9 的 条 件 最 小 二 乘 估 计 ， 并 与 Ca) 比较 

C) 求 8 的 极 大 似 然 估计 ， 并 与 (Ca) 和 CD) HR. 

(d) 在 选取 相同 参数 和 样本 规模 的 情况 下 ， 使 用 新 的 模拟 序列 重复 Cad. Cb) A Co), 
并 将 本 次 与 前 次 的 模拟 结果 进行 比较 . 

模拟 一 个 6 一 一 0.6，m 一 36 的 MAC1) 序列 

(a) 求 6 的 矩 估 计 ， 

(b) 求 和 的 条 件 最 小 二 乘 估 计 ， 并 且 与 (a) HR. 

(c) 求 86 的 极 大 似 然 估计 ， 并 与 Co 和 Cb) HR. 

(d) 在 选取 相同 参数 和 样本 规模 的 情况 下 ， 使 用 新 的 模拟 序列 重复 a), Cb) 和 C, 
并 将 本 次 与 前 次 的 模拟 结果 进行 比较 . 

模拟 一 个 6 一 一 0.6，m 一 48 的 MAC) 序列 ， 

(a) 求 86 的 极 大 似 然 估 计 ， 

(b 只 要 软件 许可 ， 以 相同 的 参数 和 样本 规模 ， 使 用 新 的 模拟 序列 多 次 重复 (ad. 

Cc) 构造 9 的 极 大 似 然 居 计 的 样本 分 布 . 

(d 估计 是 否 〈 渐 近 ) AR? 

(e) 计算 样本 分 布 的 方差 ， 并 与 方程 (7. 4. 3) 的 大 样本 结果 进行 比较 . 

以 样本 规模 n= 二 120， 重 做 习题 7. 11. 

模拟 一 个 $= 二 0.8，n 三 48 的 ARO) 序列 . 

(a) R p WATT. 

(b) 求 % 的 条 件 最 小 二 乘 估计 ， 并 与 Ca) 比较 . 

(c) 求 & 的 极 大 似 然 估计 ， 并 与 a 和 Cb) 比较 . 

(d) 在 选取 相同 参数 和 样本 规模 的 情况 下 ， 使 用 新 的 模拟 序列 重复 Cad. Cb) 和 Cc), 
并 将 本 次 与 前 次 的 模拟 结果 进行 比较 . 

模拟 一 个 g 一 一 0.5，m 一 60 的 AR(1) FFI. 

(a) OR A RATT. 

(b) 求 % 的 条 件 最 小 二 乘 估计 ， 并 与 (a) WR. 

(O 求 $ 的 极 大 似 然 估计 ， 并 与 (a) 和 (〈b) 比较 . 
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(d) 在 选取 相同 参数 和 样本 规模 的 情况 下 ， 使 用 新 的 模拟 序列 重复 (a)、(b) 和 (oc), 
并 将 本 次 与 前 次 的 模拟 结果 进行 比较 . 

.15 模拟 一 个 $= 二 0.7，n 二 100 的 ARC) 序列 . 

(a) 求 $ 的 极 大 似 然 估 计 . 

(b 只 要 软件 许可 ， 以 相同 的 参数 和 样本 规模 ， 使 用 新 的 模拟 序列 多 次 重复 (a). 

(c) 构造 乡 的 极 大 似 然 估计 的 样本 分 布 . 

Cd) 估计 是 否 〈 渐 近 ) 无 偏 ? 

(Ce) 计算 样本 分 布 的 方差 ， 并 与 方程 (7. 4. 1) 的 大 样本 结果 进行 比较 . 

.16 模拟 一 个 和 办 二 0.6， 加 二 0.3， n= 二 60 的 AR(2) 序列 . 

(a) 求 $, F $: 的 和 矩 估 计 . 

(b) 求 加 和 加 的 条 件 最 小 二 乘 估 计 ， 并 与 (a) 比较 . 

(c) R A Ald, 的 极 大 似 然 估 计 ， 并 与 Ca) 和 CD) HR. 

(d) 在 选取 相同 参数 和 样本 规模 的 情况 下 ， 使 用 新 的 模拟 序列 重复 (ad. (b) 和 (oc), 
并 将 本 次 与 前 次 的 模拟 结果 进行 比较 . 

.17 模拟 一 个 4=0.7, 0=0.4, n=72 的 ARMA(1，1) 序列 . 

(a) RO AO 的 矩 估 计 . 

(b) RG MO 的 条 件 最 小 二 乘 估计 ， 并 与 a WR. 

(c) RSMO 的 极 大 似 然 估 计 ， 并 与 (a) 和 (b) 比较 . 

(d) 在 选取 相同 参数 和 样本 规模 的 情况 下 ， 使 用 新 的 模拟 序列 重复 a), (b) 和 Co), 
并 将 本 次 与 前 次 的 模拟 结果 进行 比较 . 

.18 ”模拟 一 个 8 二 0.6,，n 二 36 的 ARO) 序列 ， 但 这 里 的 误差 项 从 具有 3 个 自由 度 的 t 分布 

中 抽样 得 到 . 

(a) 绘 出 该 序列 的 样本 PACF， 建 议 建立 ARO) 模型 吗 ? 

(b) 估计 $3， 并 解释 结果 . 

(c) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 Ca) 和 (b). 

.19 模拟 一 个 9 二 一 0.8,， n=60 的 MA(1) 序列 ， 但 这 里 的 误差 项 从 具有 4 个 自由 度 的 上 分 

布 中 抽样 得 到 . 

(a) 绘 出 该 序列 的 样本 ACF， 建 议 建立 MA(1) 模型 吗 ? 

(b) 估计 9， 并 解释 结果 . 

(c) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 (Ca) 和 (b). 

.20 ”模拟 一 个 加 二 1.0， 加 三 一 0.6,， nn 二 48 的 AR(2) 序列 ， ALAM AA 5 个 上 

由 度 的 +t 分布 中 抽样 得 到 . 

(a) 绘 出 该 序列 的 样本 PACF， 建 议 建 立 AR(2) 模型 吗 ? 

(Cb) 估计 册 和 各， 并 解释 结果 . 

(c) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 (Ca) 和 (b). 

.21 模拟 一 个 时 0.7，b= 一 0.6，n 一 48 的 ARMA(1，1) 序列 ， 但 误差 项 从 有 6 个 自由 度 

的 上 分 布 中 抽样 得 到 . 

Ca) 给 出 该 序列 的 样本 EACF， 建 议 建立 ARMA(1，1) 模型 吗 ? 
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.23 


. 24 


,25 


.26 


.27 


. 28 


. 29 


(b) 估计 岁 和 29， 并 解释 结果 ， 

(c) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 (a) 和 (b). 

模拟 一 个 $=0.6, n=36 的 AR(1) 序列 ， 但 误差 项 从 有 6 个 自由 度 的 卡 方 分 布 中 抽样 

得 到 . 

(a) 绘 出 该 序列 的 样本 PACF， 建 议 建立 ARC) 模型 吗 ? 

(b) 估计 $5， 并 解释 结果 . 

(Cc) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 (a) 和 (b). 

模拟 一 个 0=—0.8, n=60 的 MA(1) 序列 ， 但 误差 项 从 有 ?7 个 自由 度 的 卡 方 分 布 中 抽 

样 得 到 . 

(a) 绘 出 该 序列 的 样本 ACF， 建 议 建 立 MA(1) 模型 吗 ? 

(b) 估计 0， 并 解释 结果 . 

(c) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 (a) 和 Cb). 

模拟 一 个 办 三 1.0， & =—0.6, n=48 的 AR(2) 序列 ,但 误差 项 从 有 8 个 自由 度 的 卡 

方 分 布 中 抽样 得 到 . 

(a) 绘 出 该 序列 的 样本 PACF， 建 议 建 立 AR(2) 模型 吗 ? 

(b) 估计 加 和 各， 并 解释 结果 . 

Cc) 在 相同 条 件 下 ,使 用 新 的 模拟 序列 重复 a) 和 Cd). 

模拟 一 个 $==0.7，9= 二 一 0.6, n=48 的 ARMAC., 1) 序列 ， 但 误差 项 从 有 9 个 自由 度 

的 卡 方 分 布 中 抽样 得 到 . 

(a) 绘 出 该 序列 的 样本 EACF， 建 议 建立 ARMA(1，1) 模型 吗 ? 

(b) 估计 风 和 09， 并 解释 结果 . 

(c) 在 相同 条 件 下 ， 使 用 新 的 模拟 序列 重复 (a) 和 Cb). 

考虑 图 表 1-3 所 示 颜 色 属 性 的 时 间 序 列 ， 设 定 其 为 AR(1) 模型 ， 数 据 见 文件 color. 

(a) RE MAA. 

(b) 求 $ 的 极 大 似 然 估计 ， 并 与 a) 比较， 

对 于 图 表 6-31 中 所 示 的 石油 价格 对 数 的 差分 序列 ， 可 设 定 其 为 ARO) MA ARC) 模 

型 ， 数据 见 文 件 oil. price. 

(a) 对 两 个 模型 均 使 用 极 大 似 然 法 进行 估计 ， 并 与 用 AIC 准则 所 得 结果 进行 比较 . 

(b) 对 于 图 表 6-32 中 的 对 数 差分 序列 ， 建 议 设 定 为 MA(1) 模型 ， 并 用 极 大 似 然 法 进 
行 估 计 ， 并 将 结果 与 (a) 做 比较 . 

名 为 deere3 的 数据 文件 中 包含 了 来 自 Deere 公司 复合 机 床 工 具 所 生成 的 57 个 连续 数值 ， 

这 些 数 值 表 示 了 相对 于 某 目 标 值 的 偏离 量 ， 单 位 是 千 万 分 之 一 英寸 过 程 的 控制 机 制 

是 ， 根 据 上 次 产品 与 目标 值 的 偏差 程度 ， 重 置 机 床 工 具 的 若干 参数 . 

(a) 估计 该 序列 ARC) 模型 的 参数 . 

(b) 估计 该 序列 AR(2) 模型 的 参数 ， 并 与 (a) 的 结果 进行 比较 . 

名 为 robot 的 数据 文件 中 包含 了 一 个 得 自 工业 机 器 人 的 时 间 序 列 . 经 一 系列 动作 ， 机 器 

人 与 理想 终点 的 距离 将 以 英寸 为 单位 记录 下 来 ， 重复 此 过 程 324 次 得 到 该 时 间 序 列 . 

(a) 对 这 些 数 据 建立 AR(1) 模型 ， 估 计 其 参数 . 
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7.30 


7.31 


(b) 对 这 些 数据 建立 IMAC, D 模型 ， 估 计 其 参数 ， 

(c) 应 用 AIC 比较 (a) 和 (b) 的 结果 . 

名 为 days 的 数据 文件 包含 了 来 自 艾 奥 瓦 州 伯 灵 顿 市 的 Winegard 会 司 的 财务 数据 .数据 
记录 的 是 自 Winegard 产品 某 特定 分 销 商 发 出 130 个 连续 订单 后 ， 至 Winegard 收 到 付款 
之 间 相 隔 的 天 数 . (为 保密 起 见 ， 分 销 商 名 称 必须 隐匿 .) 从 时 间 序 列 图 中 明显 可 见 ， 序 
列 中 包括 若干 异常 值 . 

(a) 上 先 用 典型 值 35 天 替换 每 个 非 正 常 值 ， 再 估计 MAC) 模型 的 参数 . 

(b) 现在 假设 模型 为 MA(5)， 估 计 参 数 ， 并 与 Ca) 中 结果 进行 比较 , 

H¢=0.7 的 ARC) 模型 来 模拟 一 个 长 度 上 一 48 的 时 间 序 列 ， 把 模拟 序列 当成 真实 数据 
来 使 用 ， 针 对 的 估计 量 ， 比 较 其 理论 渐 近 分 布 与 自助 法 分 布 的 差别 . 

ARC) 模型 相当 好 地 拟 合 了 工业 颜色 属性 时 间 序 列 ， 但 序列 长 度 过 短 ， 只 有 n= 35. 
针对 由 的 估计 量 ， 比 较 其 理论 渐 近 分 布 与 自助 法 分 布 . 数据 见 名 为 color 的 文件 . 


第 8 章 模型 诊断 


到 上 自前 为 止 ， 我 们 已 经 讨论 了 识别 模型 并 有 效 估计 模型 参数 的 方法 .模型 诊断 ， 或 模型 评 
价 ， 涉 及 检验 模型 的 拟 合 优 度 ， 并 且 如 果 拟 合 程度 很 差 ， 则 给 出 适当 的 调整 建议 .我 们 介绍 两 
种 互补 的 方法 : 分 析 拟 合 模型 的 残 差 和 分 析 过 度 参数 化 的 模型 ， 即 比 目 标 模型 更 一 般 的 模型 ， 
目标 模型 作为 特例 包含 在 该 模型 中 . 


8.1 RED 


当 检 验 确定 趋势 模型 拟 合 是 否 充 分 时 ， 在 3.6 节 已 经 用 到 了 残 差 分 析 的 基本 思想 .在 自 回 
归 模 型 中 ， 残 差 的 定义 与 之 前 的 方法 类 似 ， 特别 地 ， 考 虑 一 个 带 有 常数 项 的 AR(2) 模型 : 

Y, = $Y HAY +O te, (8.1.1) 
已 经 估计 出 办， 加 ，9。， 残 差 被 定义 为 
é = Y, — $Y — $Y — ĝo (8. 1. 2) 

对 带 有 滑动 平均 项 的 一 般 ARMA 模型 ， 其 反 转 的 、 无 穷 阶 自 回归 形式 可 用 来 定义 残 差 . 

简单 起 见 ， 假 设 8 二 0。 由 模型 的 反 转 形式 ， 即 方程 (4. 5.5)， 有 

Y, = mY + m2 Y,-2 Fa Y +" i 
残 差 被 定义 为 

ê, = Y, — Ymi 一 让 2Y ,2 一 和 oY 一 … (8. 1. 3) 
这 里 ，r 不 是 被 直接 估计 出 来 的 ， 而 是 隐 含 地 作为 和 6 的 函数 计算 得 到 ， Kb, RARE 
用 这 个 方程 计算 出 来 的 ， 而 是 上 和 6 估计 量 的 副产品 .在 第 9 章 ， 将 讨论 

f, = RY, HRY +x sY g t e 
是 Y， 基于 p ’ ret ’ f= , … 的 最 优 预 测 . 因此 ， 为 了 直接 与 回归 模型 类 比 ， 方程 (8.1.3) 
可 以 重新 写 为 
残 差 二 实际 值 一 预测 值 

并 将 其 与 3. 6 节 进 行 比较 . 

如 果 模 型 被 正确 识别 ， 并 且 参 数 估 计 充 分 接近 真 值 ， 那 么 残 差 就 应 该 近似 具有 日 噪声 的 性 
质 ， 它 们 的 表现 应 该 大 概 像 那些 独立 、 同 分 布 的 具有 零 均值 和 相同 标准 差 的 正 态 变量 .与 这 些 
性 质 的 偏离 有 助 于 我 们 发 现 更 合适 的 模型 . 

残 差 图 

第 -一 个 诊断 检验 是 观察 残 差 的 时 间 序 列 图 。， 如果 模型 是 适当 的 ， 则 期 望 图 形 是 一 个 围绕 零 
水 平 线 的 、 无 任何 趋势 的 长 方形 散 点 图 . 

图 表 8-1 展示 了 一 个 这 样 的 图 形 ， 标 准 残 差 来 自 对 工业 颜色 属性 序列 拟 合 的 ARG) 模型 ， 
标准 化 使 我 们 更 容易 看 出 残 差 的 异常 值 ， 参 数 使 用 极 大 似 然 法 来 估计 .因为 没有 趋势 显现 ， 所 
以 该 图 支持 了 前 述 模 型 描述 . 

作为 第 二 个 例子 ， 考 虑 加 拿 大 野兔 丰 度 序列 .根据 图 表 7-8 之 后 的 讨论 ， 令 各 FFO f 
计 子 集合 AR(3) 模型 ， 估 计 模 型 是 

JY, 一 3.483 十 0.919V7， — 0. 5313/Y,; + e (8. 1. 4) 
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时 间 
> win.graph (width=4.875,height=3,pointsize=8) 
data (color) 
ml .color=arima (color, order=c({(1,0,0)); ml.color 
plot (rstandard(ml.color),ylab ='Standardized Residuals', 
type='0'); abline (h=0) 


V YV W YW 


这 个 模型 的 标准 残 差 的 时 间 序 列 图 展示 在 图 表 8-2 中 这里， 我 们 看 到 在 序列 中 间 部 分 残 差 的 
变化 幅度 减 小 ， 在 序列 末端 ， 残 差 的 变化 幅度 增加 -一 -并 非 精确 的 理想 的 残 差 图 


图 表 8-2 Sqrt(Hare】 序列 AR(3) 模型 的 标准 残 差 
| | 
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data (hare) 

ml. haresarima (sqrt (hare) ,order=c(3,0,9)); ml.hare 

m2 .hare=arima (sqrt (hare) ,order=c(3,0,0),fixed=c (NA, 0, NA, NA) ) 

m2.hare 

# Note that the intercept term given in R is actually the mean 
in the centered form of the ARMA model; that is, if i 
y(t)=sqrt (hare)-intercept, then the model is 
y(t) =0.919*y(t-1)-0.5313*y(t-3) +e(t) 

> # So the 'true' intercept equals 5.6389* (1-0.919+0.5313)=3.483 

> plot (rstandard(m2.hare) , ylab='Standardized Residuals',type='o') 


VY VV Vv 


> abline (h=0) i a 


图 表 8-3 展示 了 对 数 石 油价 格 时 间 序 列 IMAC, D 模型 的 标准 残 差 的 时 间 序 列 图 .该 模型 用 极 


© ”根据 Bonferroni 异常 值 准则 ， 临 界 值 是 3. 15， 看 起 来 比较 太 的 负 的 标准 残 差 并 不 是 异常 值 . 
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大 似 然 估计 来 拟 合 。 在 序列 的 前 期 ， 至少 有 两 个 或 三 个 残 差 值 大 于 3 一 一 在 标准 正 态 分 布 中 是 不 常 
多 的 ， 理想 情 况 下 ， 应 回 到 那些 月 份 并 着 力 了 解 究竟 是 哪些 外 部 因素 可 能 导致 了 油价 的 异常 涨 跌 . 


图 表 8-3 对 数 石油 价格 IMA(1，1) 模型 的 标准 残 差 


标准 残 差 


1990 1995 2000 2005 


data (oil .price) 

ml .oil=arima (log (oil .price) ,order=c(0,1,1)) 

plot (rstandard(m1.oil),ylab='Standardized residuals',type='1') 
abline (h=0) 


VY Vv VV 


残 差 的 正 态 性 

正如 我 们 在 第 3 章 中 看 到 的 ， 分 位 数 -分 位 数 图 是 一 种 有 效 地 评估 正 态 性 的 工具 . 这 里 我 
们 把 它 应 用 在 残 差 上 . 

图 表 8-4 展示 了 残 差 的 分 位 数 -分 位 数 图 ， 残 差 来 自 对 工业 颜色 属性 序列 估计 的 AR(1) 模 
型 。 这 些 点 看 起 来 非常 接近 一 条 直线 一 一 特别 是 在 极 值 处 ， 该 图 使 我 们 不 能 拒绝 模型 误差 项 是 
正 态 的 假设 . 另外， 应 用 于 残 差 的 Shapiro- Wilk EAR BEAM Sit MA W=0.9754, 4 
对 应 的 p 值 为 0.6057， 基 于 这 个 检验 ， 不 能 拒绝 正 态 性 . 


图 表 8-4 颜色 序列 AR(1) 模型 残 差 的 分 位 数 一 分 位 数 图 


理论 分 位 数 


a aaaaaauaaaaaaaaaaaaaaaaaaaaaaaauaalaaassssassaaasasasaatltltl$ltl 


> win.graph (width=2.5,height=2.5,pointsize=8) 
> qqnorm(residuals(m1.color) ) ; qqline (residuals (m1.color) ) 
i LR 


© %n=241, a=0.05 Hf, Bonferroni 的 临界 值 是 士 3. 71， 因 此 异常 值 看 起 来 是 真 的 存在 ， 我 们 将 在 11 章 对 异常 值 建 模 . 


sd #8# 


野兔 丰 度 时 间 序 列 平方 根 的 ARC3) 模型 的 残 差 的 分 位 数 -分 位 数 图 展示 在 图 表 8-5 中 .这 
里 的 极 值 看 起 来 有 点 可 疑 . 但 是 ， 如 前 所 述 ， 由 于 样本 比较 小 (az 一 31)， 发 现 异 常 值 的 Bor 
ferroni 准则 没有 给 我 们 毅 啊 警钟 . 


图 表 8-5 野兔 序 列 AR(3) 模型 残 差 的 分 位 数 一 分 位 数 图 


样本 分 位 数 


理论 分 位 数 


> dqnorm(lresiduals (ml .hare) ); qqline (residuals (ml .hare)) 


图 表 8-6 给 出 了 对 数 石油 价格 序列 IMAC, 1) 模型 的 残 差 的 分 位 数 -分 位 数 图 ， 此 处 异常 
值 非常 明显 ， 我 们 将 在 第 11 章 处 理 它们 . 
图 表 8-6 石油 IMA(1，1) 模型 残 差 的 分 位 数 一 分 位 数 图 


= 
b 


样本 分 位 数 


理论 分 位 数 


> qqnorm (residuals (m1 .cil1) ) ; qqline (residuals (ml .oi1)) 


REMAX 

YTRA pe PSE, ARPA KR, EA. MAH (6.1.3) 
我 们 知道 对 于 真正 的 白 噪声 和 较 大 的 n， 样 本 自 相 关 函 数 近 似 无 关 并 且 服 从 均值 为 0、 方 大 为 
1/n 的 正 态 分 布 ， 遗 憾 的 是 ， 即 使 对 于 参数 佑 计 有 效 的 正确 识别 的 模型 ， 其 残 差 也 会 具有 未 邱 
不 同 的 特性 ， 这 一 点 最 早 由 Durbin 和 Watson(1950, 1951, 1971) 在 一 系列 文章 中 对 多 元 回 
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归 模 型 进行 了 研究 ，Durbin(1970) 对 自 回 归 模 型 进行 了 研究 ， 关 于 ARIMA 模型 残 差 自 相关 
分 布 的 主要 参考 文献 是 Box 和 Pierce(1970), McLeod(1978) 推广 了 该 文 的 结论 . 

一 般 地 ， 残 关 近 似 服 从 零 均 值 的 正 态 分 布 ， 但 是 ， 对 于 较 小 的 滞后 有 上 和， 六 的 方差 远 远 
小 于 l/n, WRA WA 是 高 雇 相 关 的 ， 对 于 较 大 的 滞后 ， 可 以 使 用 近似 方差 1/n， 进 一 步 ， 
Ps 和 六 是 近似 不 相关 的 . 

作为 这 些 结论 的 一 个 例子 ， 考 虑 一 个 正确 识别 并 且 被 有 效 估计 的 AR(1) 模型 ， 对 于 较 大 
的 ma， 可 以 证 明 


# 
Vari) = — (8. 1.5) 
— (1 — dyd 
Vara) ~ =O, k>] (8. 1. 6) 
— Al bk? 
Corr(?) ,Fi) =— sign(¢) —#)¢ k> 1] (8.1.7) 


1 ¢>0 
sign(#) =| 0 一 0 


—1 P<=0 
图 表 8-7 用 不 同 的 $ 值 和 点 值 阐释 了 这 些 公式 ， 注 意 宇 2 时 ， 对 广泛 范围 内 的 % 值 ，Var( 广 )s1/m 
都 是 一 个 合理 的 近似 . 


其 中 ， 


”图表 8-7 AR(1) MRR A AK RM IEE 


$ 0.3 0. 5 0.7 09 Te] 0.3 0.5 0.7 0.9 
t | Pa ROAT MEE TRL e es J 
1 0. 30 0. 50 0. 70 0. 90 1. 00 1.00 1. 00 1. 00 
2 0. 96 0. 90 0. 87 0. 92 一 0. 95 —0. 83 —0. 59 一 0.21 
3 1. 00 0. 98 0. 94 0. 94 —0, 27 —0. 38 —0. 38 一 0.18 
4 1. 00 0. 99 0. 97 0. 95 一 0.08 —0. 19 一 0. 26 —0. 16 
5 1.00 1. 00 0. 99 0. 96 一 0.02 一 0. 09 一 0.18 一 0. 14 
6 1. 00 1. 00 0.99 0.97 一 0.01 一 0.05 ~0.12 —0. 13 
7 1. 00 1. 00 1. 00 0. 97 0. 00 一 0. 02 —0. 09 —0. 12 
8 1.00 1. 00 1. 00 0.98 —0. 00 ~9, 01 —0. 06 —0. 10 
9 1. 00 1.00 1. 00 0. 99 —0. 00 一 0.00 一 0.03 —0. 08 


如 果 将 这 些 结果 应 用 到 对 工业 颜色 属性 时 间 序列 估计 的 AR(1) 模型 ， 其 中 % 一 0. 57，? 一 
35， 得 到 图 表 8-8 所 示 的 结果 . 


图 表 8-8 RE AC 值 的 近似 标准 差 


滞后 上 1 2 3 4 5 >5 
/Va 0. 096 0. 149 0. 163 0. 167 0. 168 0. 169 


图 表 8-9 展示 了 这 些 残 差 的 样本 ACF 图 .图 中 虚 的 水 平 线 是 基于 较 大 滞后 下 士 2/Vn 的 标 
准 误差 画 出 的 .该 模型 的 残 差 没有 自 相 关 的 迹象 . 


图 表 8-9 颜色 序列 AR{(1) 模型 残 差 的 样本 ACF 


ig ee yea ee 
0.1 
一 
Q 
< 
-0.1 
i 
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2 4 6 8 10 12 14 
滞后 


> win.graph (width=4.875,height=3,pointsize=8) 
> acf (residuals (ml .color)) 


对 AR(2) 模型 ， 可 以 证 明 


2 
Var(P ) a a (8. 1. 8) 


# +e +¢)’ 


n 
如 果 AR(2) 参数 并 不 是 非常 接近 图 表 4- 17 显示 的 平稳 域 边界 ， 则 
Var) ~ + ， k>3 (8. 1. 10) 


如 果 对 野兔 丰 度 平方 根 序列 用 极 大 似 然 估计 法 拟 合 一 个 AR(2) BMS, HF, = 1.351, 
$= 二 一 0.776， 因 此 ， 有 


/VE xe 19-7761 0.131 
/35 


— 2 一 —_ 
Vath) = /( 0.776) FC. 35D UF 0. 276990" ayy 


VVaf(F) = 1/4/35 = 0.169, k>3 
图 表 8-10 展示 了 野兔 丰 度 平方 根 序列 ARC) 模型 残 差 的 样本 ACF. 此 处 1 阶 沾 后 目 相 
关系 数 等 于 一 0. 261， 接 近 于 小 于 零 的 两 倍 标准 误差 ， 但 不 是 特别 接近 . 4 阶 洁 后 自 相 关系 数 
等 于 一 0. 318， 但 是 其 标准 误差 等 于 0.169， 可 以 得 出 结论 ， 这 张 图 没有 提供 残 差 非 零 自 相 关 
系数 在 统计 上 的 显著 证 据 ®. 
对 月 度数 据 ， 应 该 特别 注意 在 滞后 为 12、24 等 处 残 差 的 可 能 出 现 的 过 度 的 自 相关 系数 .对 季度 
数据 序列 ， 在 滞后 为 4、8 等 处 的 自 相关 系数 值得 特别 关注 .第 10 章 包 含 了 这 些 概 念 的 例子 . 


(8. 1. 9) 


Var(f,) a 


O ARD 模型 不 如 前 面 估计 的 ARCS) 模型 的 拟 合 效果 好 ， 但 是 拟 合 程度 仍然 相当 好 ， 在 此 可 以 作为 一 个 合理 的 
例子 . 
O WER ARCS) 模型 对 这 些 数据 拟 合 得 更 好 ， 并 且 残 差 其 至 具有 更 小 的 自 相 关 ， 见 习题 8.7. 
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图 表 8-10 野兔 序列 AR(2) 模型 残 差 的 样本 ACF 


> acf (residuals (arima (sqrt (hare) ,order=c(2,0,0)))) 


可 以 证 明 ， 与 AR 模型 类 似 的 结论 对 MA 模型 同样 成 立 . 特别 地 ， 在 方程 GLD 
(8.1.6). (8.1.7) F, Ae eee 就 得 出 MAC) 情况 下 的 结论 ， 类 似 地 ， 用 抽 、 见 分 别 替 
换 方程 (8.1.8)、(8.1.9) 和 (8.1. 10) 中 的 册 、 上 页 ， 可 得 出 MA(2) 情况 下 的 绪论. 在 Box 
和 Pierce(1970) 及 McLeod(1978) 中 ， 可 以 找到 适用 于 一 般 ARMA 模型 的 结论 . 

Ljung-Box 检验 

除了 观察 各 个 单独 的 滞后 处 残 差 的 相关 系数 ， 将 这 些 相关 系数 的 值 作为 一 个 组 来 进行 检验 
也 是 有 用 的 ， 例 如 ， 有 可 能 大 多 数 残 差 自 相关 系数 是 适度 的 ， 一 些 其 至 接近 临界 值 ， 但 是 作为 
一 个 整体 时 ， 它们 看 起 来 就 是 过 度 的 . Box 和 Pierce(1970) 提出 统计 量 

Q = n(A +A te + Pk) 《8. 1.11) 
来 检验 这 种 可 能 性 ， 如 果 和 估计 的 是 正确 的 ARMA(p，g) 模型 ,那么 对 于 大 的 n，Q 近似 服从 
自由 度 为 K 一 p 一 g 的 卡 方 分 布 ， 拟 合 一 个 错误 的 模型 将 会 增 大 Q 值 ， 因 此 ， 如 果 观 测 到 Q 值 
超过 了 自由 度 为 KK 一 p 一 g 的 卡 方 分 布 给 出 的 适当 临界 值 ， 广义 “混合 检验 ”将 拒绝 ARMA 
(p. g) 模型 (此 处 ， 最 大 滞后 长 度 K 的 选择 有 一 定 的 随意 性 ,但 要 足够 大 以 使 当 7 二 K 时 ， 
可 以 忽略 多 权重 . ) 

Q 的 卡 方 分 布 是 基于 n>co 时 的 极限 理论 得 到 的 ,但 是 Ljung 和 Box(1978) 随后 发 现 ， 即 
(E n=100 时 ， 近 似 值 也 并 不 令 人 满意 ， 通 过 稍微 修正 统计 量 Q， 他 们 定义 了 一 个 检验 统计 
量 ， 对 于 典型 的 样本 容量 来 说 ， 该 统计 量 零 假 设 下 服从 的 分 布 更 接近 卡 方 分 布 ， 修正 的 Box- 
Pierce， 或 者 Ljung- Box 统计 量 由 下 式 给 出 : 


Q. = na +D (a 2 


A Ea.. 
| | (8. 1. 12) 


注意 ， 因 为 对 每 个 上 宇 ] 均 有 (nt2)/(n—k)>l, an Q, 二 Q， 这 部 分 解释 了 为 什么 原来 
的 统计 量 Q 倾向 于 忽略 不 恰当 的 模型 .对 于 有 限 样本 下 Q. 和 Q 确切 分 布 的 详细 讨论 可 以 参阅 
Liung 和 Box(1978) 以 及 Davies, Triggs 和 Newbold(1977). 

图 表 8-11 列举 了 颜色 属性 序列 拟 合 的 ARC) 模型 残 差 的 前 6 个 自 相 关系 数 . 这 里 "一 35. 
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图 表 8-11 颜色 序列 AR(1) 模型 残 差 的 自 相 关 值 
滞后 1 2 3 4 5 6 
A% ACF 一 0. 051 0. 032 0. 047 0. 021 一 0.017 0. 019 
> acf (residuais (m1.color) ,plot=F})$acf 
> signif (acf (residuals (m1.color),plot=F)$acf[1:6] ,2) 
> # display the first 6 acf values to 2 significant digits 


K=6 Hf, Ljung-Box 检验 统计 量 等 于 
E (— 0.051)? , (0.032)? , (0.047)? , (0.021)? , (— 0.017} , (— 0. 019) 
Q. = 35635 + 2)( 35— 1 十 35 一 2 二 -35 二 3 十 35 二 全 十 35 一 5 + 35— 6 ) 


az 0. 28 
此 时 服从 一 个 自由 度 为 6 一 1=5 的 卡 方 分 布 . 由 此 得 到 p 值 等 于 0. 998， 所 以 没有 证 据 来 拒绝 
误差 项 是 不 相关 的 零 假设 . 
图 表 8-12 在 一 张 图 中 展示 了 三 种 诊断 工具 一 一 标准 残 差 的 序列 图 、 残 差 的 样本 ACF, K 
从 .5 到 15 的 Liung-Box 检验 统计 量 的 p 值 在 5% 处 的 水 平 虚 线 有 助 于 判断 p 值 的 大 小 . 在 
这 个 例子 中 ， 一切 看 起 来 都 非常 好 .估计 的 ARO) 模型 看 起 来 非常 好 地 捕获 了 颜色 属性 时 间 
序列 的 相关 结构 . 


图 表 8-12 对 颜色 属性 序列 AR(1) 模型 的 诊断 展示 


0 o o o 


标准 残 差 


残 差 的 ACF 


p 值 


> win.graph (width=4.875,height=4.5) 
> tsdiag(ml.color,gof=15,omit.initial=F) 


正如 第 3 章 -一 样 ， 游 程 检验 可 以 通过 残 差 来 评价 误差 项 的 相关 性 ， 对 加 拿 大 野兔 丰 度 序列 
ARG) 模型 的 残 差 应 用 该 检验 ， 得 到 预期 游程 数 是 16. 09 677， 观 测 到 的 游程 数 是 18， 相 应 的 
pE 0. 602， 所 以 没有 统计 上 显著 的 证 据 否 定 该 模型 误差 项 的 独立 性 . 


8.2 过度 拟 合 和 参数 元 余 
第 二 个 基本 的 诊断 工具 是 过 度 拟 合 ， 识 别 并 拟 合 出 我 们 认为 合适 的 模型 之 后 ， 拟 合 一 个 更 一 般 
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的 模型 ， 即 一 个 “接近 ”的 模型 ， 该 模型 以 原始 模型 为 特例 包容 原始 模型 ， 例如， 如 果 ARO 模 
型 看 起 来 是 恰当 的 ， 可 能 会 过 度 拟 合 一 个 ARG) 模型 ， 我 们 会 确认 原始 的 ARC) 模型 ， 如 果 ，; 

1. 额外 的 参数 加 的 估计 不 显著 地 不 为 零 ， 并 且 

2. 共同 的 参数 办 AMS 的 估计 与 原始 的 估计 相 比 没有 显著 的 改变 . 

作为 例子 ， 我 们 已 经 为 工业 颜色 属性 时 间 序 列 识别 、 拟 合并 检验 了 ARCO) 模型 的 残 差 ， 图 
# 8-13 展示 了 R 软件 拟 合 ARCO) 模型 的 输出 ， 图 表 8-14 展示 了 对 相同 的 时 间 序 列 拟 合 AR(2) 
模型 的 结果 . 首先 注意 到 ， 在 图 表 8-14 中 , 6 的 估计 在 统计 上 并 不 显著 地 不 等 于 零 . 这 个 事实 
支持 我 们 选择 ARCO) MH. HK, ERAS 的 两 个 估计 值 相当 接近 一 一 特别 是 当 考 虑 它们 的 
标准 误差 的 大 小 时 ， 最 后 ， 注 意 到 虽然 AR(2) 模型 有 稍微 大 一 些 的 对 数 似 然 值 ， 但 是 ARQ) 
拟 合 有 较 小 的 AIC 值 ， 拟 合 一 个 更 复杂 的 AR(2) 模型 的 代价 大 到 足够 使 我 们 选择 一 个 更 简单 
的 ARC) 模型 


图 表 8-13 颜色 属性 序列 AR(1) 模型 估计 结果 


系数 中 arl REO 
0. 5705 74. 3293 
5 估计 0. 1435 1. 9151 


o 的 估计 值 为 24., 83， MWR = — 106.07, AIC=216. 15 


中 用 m1 .CoLoz#R 代 码 得 到 表格 ， 
回回 顾 这 里 的 截 距 是 过 程 均值 w 而 不 是 8 的 估计 


PO {EO 


图 表 8-14 颜色 属性 序列 AR(2) 模型 估计 结果 


系数 arl ar2 RIE 
0. 5173 0. 1005 74. 1551 
og 估计 0. 1717 0. 1815 2. 1463 


of 的 估计 值 为 24. 6， 对 数 似 然 值 = 一 105. 92，AIC=217. 84 


> arima (color,order=c(2,0,0)) 


可 以 尝试 ARMA(1，1) 模型 来 为 该 序列 进行 一 个 不 同 的 过 度 拟 合 ， 图表 8-15 展示 了 拟 
合 结果 .注意 到 估计 系数 的 标准 误差 比 我 们 在 图 表 8-13 和 8-14 中 看 到 的 要 大 得 多 . 不 管 怎样 ， 
该 拟 合 中 加 的 估计 并 不 是 显著 不 同 于 图 表 8-13 中 的 估计 . 另外 ， 与 之 前 一 样 ， 新 参数 9 并 不 
显著 不 为 零 . 这 为 AR(1) 模型 提供 了 进一步 的 支持 . 


图 表 8-15 ”对 颜色 序列 过 度 拟 合 ARMA(1，1) 模型 


系数 arl mal RE 
7 0. 6721 一 0. 1467 74. 1730 
o 估计 0. 2147 0. 2742 2.1357 


o 的 估计 值 为 24. 63: 对 数 似 然 值 = 一 105. 94，AIC 一 219. 88 


> arima(color,order=c(1,0,1)) 


eet 


正如 我 们 提 到 过 的 ， 任 何 ARMACp, q) 模型 都 可 以 看 成 是 一 个 更 一 般 的 ARMA 模型 的 
特例 ， 只 要 令 额 外 的 参数 为 零 .， 但 是 在 一 般 化 ARMA 模型 时 ， 我 们 必须 意识 到 参数 宛 余 或 不 
可 识别 的 问题 . 

为 了 解释 清楚 这 一 点 ， 考 虑 一 个 ARMA(1，2) 模型 

Y, = $Y, 1 +e, — be, — bze (6.2713 
现在 用 :一 1 代替 et. BA 
5 = $Y -2 十 ei z 0 €;—2 — hes (8. 2. 2) 
如 果 在 方程 (8.2.2) 两 边 同 时 乘 以 任意 常数 c， 然 后 从 方程 〈8. 2. 1) 中 将 其 减 去 ， (整理 后 ) 
得 到 
Y ,一 (gg 十 c)Y_ 十 %cY =e — (O tc)e — (62 — 0d e,-2 teze- 
这 个 方程 显然 定义 了 一 个 ARMA. 3) 过 程 ， 但 是 注意 有 因 式 分 解 
1 — ($+ c)r+$cr’? = (1 —pr)(l— cr) 
m l 
1 — (6, 十 c)z 一 (6 — ch r te = 1-82-8022’) (1 — cr) 
因此 ，ARMA(2，3) 过 程 中 ，AR 和 MA 的 特征 多 项 式 具有 共同 的 因子 1 一 cr. 即使 Y, 满足 
ARMA(2, 3) 模型 ， 显 然 模 型 中 的 参数 不 是 唯一 的 一 一 常数 c 完全 是 任意 的 我们 称 在 AR- 
MA(2，3) 模型 中 存在 参数 宛 余 问 题 ”. 

拟 合 和 过 度 拟 合 模型 的 含义 如 下 : 

1. 小 心 识 别 一 个 原始 模型 ， 如果 一 个 简单 模型 看 起 来 是 有 和 希望 的 ， 那 么 在 尝试 拟 合 一 个 
更 复杂 的 模型 前 要 先 对 该 模型 进行 检验 ， 

2. 在 过 度 拟 合 时 ， 不 要 同时 增加 AR 和 MA 部 分 的 阶 数 . 

3. 按 残 差分 析 建 议 的 方向 来 扩展 模型 ， 例 如， 如 果 拟 合 了 MAC) 模型 后 ， 残 差 在 2 brig 
后 处 仍 存在 明显 的 相关 性 ， 则 应 该 尝试 MA(2) 模型 ， 而 不 是 ARMA(1，1) 模型 . 

作为 例子 ， 再 次 考虑 颜色 属性 序列 .我 们 已 经 发 现 AR(1) 模型 拟 合 得 相当 好 .假设 尝试 
ARMA(2, 1) 模型 ， 拟 合 结果 显示 在 图 表 8-16 中 . 注意 即使 的 估计 值 、 对 数 似 然 值 和 
AIC 值 与 它们 的 真 值 之 间 相 差 不 是 太 大 , 由、 史 和 60 的 估计 值 与 真 值 也 有 很 大 偏离 ， 没 有 一 个 
从 统计 上 看 是 显著 不 等 于 零 的 . 


图 表 8-16 ”对 颜色 属性 序列 过 度 拟 合 的 ARMA(2,1) 模型 


系数 arl ar2 z mal AE 
0. 2189 0. 2735 0. 3036 74.1653 
5 估计 2. 0056 1. 1376 2. 0650 2.1121 


o 的 估计 值 为 24.58: MRA — 105.91, AIC=219. 82 
> arima(color,order=c(2,0,1)) 


8.3 小 结 
本 音 中 大 大 延伸 了 第 3 章 里 的 残 差分 析 思 想 . 通过 检验 误差 项 的 同方 差 性 、 正 态 性 和 独立 


O ERRATAS, WEBY, SAB e 是 正确 模型 ， 则 对 任意 常数 c， 模 型 (1—cB)¢(B)Y,= (1— cB Bde, 
也 是 正确 的 模型 。 为 合 ARMA 模型 参数 化 具有 了 唯一 性 ， 必 须 约 掉 AR 和 MA 特征 多 项 式 的 任何 公 因 子 . 
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性 ， 我 们 看 到 了 各 种 残 善 图 ， 在 这 些 诊 断 中 ， 残 差 的 样本 目 相 关 性 起 到 了 相当 重要 的 作用 ， 对 
Ljung-Box 统计 量 混合 检验 的 讨论 ， 可 作为 残 送 目 相关 性 的 小 结 ， 最 后 ， 还 介绍 了 过 度 拟 合 和 
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8.1 对 某 ¢0.5 Al n=100 的 ARG) EH, REN 1 阶 滞后 样本 上 自 相 关系 数 为 0.5， 这 有 无 
异常 ? 原因 何在 ? 

8.2 对 某 0==0.5 Aln=—100 的 MA(1) 模型 ， 重 复习 题 8. 1， 

8.3 基于 一 个 长 度 为 n= 二 200 MFI. WA AR(2) 模型 ， 得 到 残 差 自 相 关系 数 广 一 0. 13， 
六 一 0. 13， 名 二 0.12， 如 果 训 二 1.1， 各 二 一 0.8， 这 些 残 差 自 相 关系 数 支持 AROC) 的 
识别 吗 ? 单个 地 看 是 否 支 持 ? 联合 起 来 看 是 否 文 持 ? 

8.4 模拟 n=30, $= 二 0.5 的 ARC) 模型 ， 

(a) 拟 合 正确 识别 的 AR(1) 模型 ， 并 观察 残 差 的 时 间 序 列 图 ， 该 图 支持 ARO) 的 模型 
设 定 吗 ? 

(b) 展示 标准 残 差 的 正 态 分 位 数 -分 位 数 图 ， 该 图 支持 ARO) 的 识别 吗 ? 

(c) 展示 残 差 的 样本 ACF， 该 图 支持 ARG) 的 识别 吗 ? 

(d) 计算 Ljung-Box 统计 量 ， 求 和 至 久 =8， 该 统计 量 支持 ARG) 的 识别 吗 ? 

8.5 模拟 n= 二 36, 9== 一 0.5 的 MA(1) 模型 . 

(a) 拟 合 正确 设 定 的 MA(1) 模型， 观察 残 差 的 时 间 序 列 图 ， 该 图 文 持 MA(1) WH 
别 吗 ? 

(b) 展示 标准 残 差 的 正 态 分 位 数 -分 位 数 图 ， 该 图 支持 AR(1) 的 识别 吗 ? 

(c) 展示 残 差 的 样本 ACK, BART MAG) 的 识别 吗 ? 

(d) 计算 Ljung-Box 统计 量 ， 求 和 至 K=6, KRA ARO) 的 识别 吗 ? 

8.6 模拟 n= 二 48， $,=1.5, 加 二 一 0.75 BY AR(2) 模型 . 

(a) 拟 合 正确 识别 的 AR(2) 模型 ， 观 察 残 差 的 时 间 序 列 图 ， 该 图 支持 ARO) 的 识 
别 吗 ? 

(b) 展示 标准 残 差 的 正 态 分 位 数 - 分 位 数 图 ， 该 图 支持 AR(2) 的 识别 吗 ? 

Cc) 展示 残 差 的 样本 ACF， 该 图 支持 ARC) 的 识别 吗 ? 

(d) 计算 Ljung-Box 统计 量 ， 求 和 至 K=12, BRP RR ARC) 的 识别 吗 ? 

8.7 ”对 野兔 丰 度 平方 根 序列 (文件 名 haro 用 极 大 似 然 估 计 法 拟 合 ARG) 模型 . 
(a) 画 出 残 差 的 样本 ACF. 评论 一 下 相关 性 的 大 小 . 
(b) 计算 Liung-Box 统计 量 ， 求 和 至 及 二 9， 该 统计 量 支持 ARG) 的 识别 吗 ? 
(c) 对 残 差 进行 检验 ， 并 对 结果 进行 评论 ， 
(d) 展示 残 差 的 正 态 分 位 数 -分 位 数 图 ， 并 对 图 形 进行 评论 . 
Ce) 对 残 差 的 正 态 性 进行 Shapiro- Wilk 检验 . 

8.8 考虑 图 表 1-8 显示 的 滤 油 器 销售 数据 ， 数 据 保存 在 名 为 oilfilters 的 文件 中 . 
(a) 对 序列 拟 合 ARC) 模型 ， 参 数 # 的 估计 在 统计 上 显著 地 不 为 零 吗 ? 
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(b) 展示 拟 合 模型 ARCO) 残 差 的 样本 ACF， 对 图 形 进行 评论 . 

8.9 名 为 robot 的 数据 文件 包含 了 来 自 工 业 机 器 人 的 一 个 时 间 序 列 . 机 器 人 需要 完成 一 系列 
的 动作 ， 距 离 目 标 终 点 的 长 度 以 英寸 为 单位 记录 . 重复 324 次 得 到 该 时 间 序 列 . 用 本 章 
讨论 的 诊断 检验 比较 对 这 些 数 据 拟 合 的 AR(1) 模型 和 IMA(1，1) 模型 . 

8.10 名 为 deere3 的 数据 文件 包含 了 57 个 连续 的 数值 ， 数 据 来 自 Deere 公司 的 一 个 复杂 的 机 
床 . 给 出 的 数值 是 与 目标 值 的 偏离 程度 ， 以 千 万 分 之 一 英寸 为 单位 . 该 过 程 的 控制 机 制 
为 ， 依 据 上 期 产品 偏离 目标 值 的 幅度 来 重 置 机 床 的 某 些 参数 . 用 本 章 讨 论 的 检验 来 诊断 
AR(1) 模型 对 这 些 数据 的 拟 合 程度 . 

8.11 图 表 6-31 建议 对 石油 价格 的 对 数 差 分 序列 识别 AR(1) 模型 或 者 AR(4) 模型 〈 文 件 名 
为 oil. price). 

Ca) 用 极 大 似 然 估计 法 估计 两 个 模型 ， 用 本 章 讨论 的 诊断 检验 对 结果 进行 比较 . 

(b) 图 表 6-32 建议 为 对 数 差 分 序列 设 定 MA(1) 模型 ， 用 极 大 似 然 法 估计 该 模型 并 用 
本 章 讨论 的 检验 进行 诊断 . 

(c) 基于 (a), b) 部 分 给 出 的 结果 ， 你 更 偏好 ARC), ARG) 和 MA(1) 三 个 模型 
中 的 哪 一 个 ? 
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时 间 序 列 建 模 的 主要 目标 之 一 ， 是 了 观测 该 序列 未 来 的 取 值 ， 而 同等 重要 的 是 评估 预测 的 精 
ME. 本草 将 对 确定 性 趋势 模型 和 ARIMA 模型 ， 考 察 其 预测 的 计算 及 属性 ， 也 讨论 结合 
ARIMA 随机 项 与 确定 性 趋势 之 模型 的 预测 问题 . 

在 大 多 数 情况 下 ， 假 定 模型 已 确 知 ， 包 括 所 有 参数 的 具体 取 值 . 尽管 这 一 点 实际 上 根本 不 
可 能 具备 ， 但 是 使 用 大 样本 容量 的 参数 估计 对 结 采 的 影响 不 大 . 


9.1 最 小 均 方 误差 预测 


基于 序列 可 获得 的 直到 时 间 t RO Pa, EYL, Yoo. Yo, Yo MMR HR 
You. RN: 为 预测 起 点 ，Z 为 预测 前 置 时 间 ， 而 用 YC) 代表 预测 值 . 
正如 在 附录 下 中 所 示 ， 最 小 均 方 误差 预测 如 下 : 
YD = ECY m [Yi YY.) (9.1.1) 
CERME E AF BR, EE T a PS A R YES.) 
本 章 后 续 部 分 将 专注 于 上 述 和 预测 相关 联 的 条 件 期 望 的 计算 及 其 性 质 的 研究 . 


9.2 确定 性 趋势 
再 次 考虑 第 3 章 的 确定 趋势 模型 
Y, =a tX: (9.2.1) 
其 中 随机 项 X, 有 零 均值 ， 本 节 假 定 (X) 是 方差 为 n 的 白 品 声 ， 对 于 方程 〈9.2.1) 中 的 模 
型 ， 有 
YD = Elum + Xe l Yi Ye) 
= Eure |YisYoot Vi) + ECX oe |Yie Yo oe 7,) 
= pe H EC Xue) 
或 者 
¥,() = mm, 2. 2) 
EAA, Mel, Xu MILF Yi, Yo oes Yis i: 上 且 具 有 零 期 望 值 ， 因 而 在 此 简单 情况 
下 ， 预 测 等 同 于 将 确定 性 时 间 趋 势 外 推 至 未 来 时 刻 上 . 
对 于 线性 趋势 的 情况 ，j = 让 十 Bt 上， 预测 是 
PD =BR{tAcdc+o (9. 2. 3) 
正如 第 3 章 中 所 强调 的 ， 该 模型 假定 相同 的 线性 时 间 趋 势 持续 到 了 未 来 ， 从 而 预测 反映 出 此 种 假设 . 
$E, EEHT YMY Ye ,… ,YY ， 世 之 间 缺 乏 统计 依赖 性 ， 所 以 不 能 改进 w+ 以 用 作 预 测 ， 
对 于 季节 模型 ， 比 如 有 =p, WOMB, (O Surre Ý tD. PEE N 
也 具有 周期 性 . 
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预测 误差 ce. 给 定 如 下 : 
el = Yue — Ô, O = pre + Xe — pte = Xu 
故 有 
E(e,()) = E(Xu,) = 0 
这 说 明 ， 预 测 是 无 偏 的 ， 另 外 ， 
Var(e,(2)) = Var(Xun,) = Yo (9. 2. 4) 
是 预测 误差 方差 ， 对 所 有 前 置 时 间 2 PR. 
第 3 章 估计 月 平均 气温 序列 的 余弦 趋势 模型 为 
应 = 46. 2660 + (— 26. 7079) cos(2at) 十 (一 2.1697)sin(C2xt ) 
这 里 时 间 从 1964 年 1 月 开始 按 年 记录 ， 每 年 频率 f 二 1， 最 后 观察 值 是 1975 年 12 月 的 .为 预 
测 1976 年 6 月 的 气温 ， 用 上 一 1976. 416 67 作为 时 间 值 SS ， 得 到 
fi: = 46. 2660 十 (一 26.7079)cos(2x(1976. 416 67)) + (— 2. 1697)sin(2r(1976. 416 67)) 
= 68. 3°F 
类 似 地 ， 可 得 其 他 月 份 的 预测 值 . 


9.3 ARIMA 预测 


对 于 ARIMA 模型 ， 预 测 可 以 有 不 同 的 表达 方式 ， 每 种 方式 在 计算 、 更 新 、 精 确 度 评 佑 或 
者 长 期 预测 行为 等 方面 ， 都 有 助 于 对 预测 整体 流程 的 理解 . 


AR(1) 
首先 用 满足 下 式 的 简单 非 零 均值 ARG) 来 说 明 诸多 观点 : 
Y, — u = $Y -1 — pw) +e, (9. 3. 1) 
考虑 未 来 一 期 预测 的 问题 ， 在 公式 (9.3.1) 中 用 t 十 1 代替 :， 得 到 
Yr — y = PCY, 一 A) 十 er (9. 3. 2) 
WE Y, Ya yey, Yis Yrs ERR (9.3.2) 两 边 取 条 件 期 望 得 
Y,(1) — y = $LECY, |Y YY) — u] + Eleni | Yrs Yan Ye) (9. 3. 3) 
现在 ， 根 据 条 件 期 望 的 性 质 ， 有 
ECY,|Y15Yoo°»¥,) =Y, (9. 3. 4) 
此 外 ， 因为 e+1 独 立 于 人 了 Ficus: Xit MA 
Een, |Y; Yoo» Y,) = Eleni) = 0 (9. 3.5) 
因此 ， 公 式 (9.3.3) 可 写成 
Y,(1) = p+ $Y,— p) (9. 3. 6) 


简单 来 说 就 是 ， 将 当期 偏离 过 程 均值 之 值 的 $ 倍 添加 到 过 程 均值 上 来 预测 下 一 期 的 值 . 
现在 考虑 一 般 的 前 置 时 间 l， 在 公式 (9. 3. 1) 中 用 t+ 代替:， 两 边 同 取 条 件 期 望 得 
YO = p+, — 1) pu], l=1 (9. 3. 7) 


CO 6 月 为 该 年 的 第 5 TA, H 5/120. 416 666 666…. 
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AAA EY, ei l|Yis Yeo, YO=V,C—-1), MAM L1, etA FY’ Y: Vi. Y.. 

前 置 时 间 2 的 递归 公式 (9.3.7) 表明 ， 对 任何 前 置 时 间 t 的 预测 可 以 得 自 更 短 前 置 时 间 
的 预测 .根据 公式 (9. 3. 6)， 自 计算 初始 预测 Y,(1) 开始 ， 再 预测 六, (2) 二 py 十 $ [Y,(1) 一 jj， 
继而 由 Y,(2) 推出 (3)， 依 次 类 推 直至 得 到 六 (1)， 公 式 (9.3.7) 及 针对 其 他 ARIMA 模型 
的 推广 是 实际 计算 预测 值 最 简便 的 方法 ， 有 时 也 被 称 为 预测 的 差分 方程 形式 . 

然而 ， 从 序列 的 观测 历史 角度 看 ， 解 公式 (9. 3.7) 也 可 得 出 预测 的 显 式 表达 式 ， 在 公式 
(9.3.7) 中 后 向 迭代 Z， 有 

Y,(2) = #LY,-1) —pl) +p 
= $(@[Y,(¢—2)—p]} +p 


= H[f, 0) —p)t+yz 
或 者 
Ñ, (L) = pt $' (Y, —p) (9. 3. 8) 

当期 偏离 均值 的 量 有 折扣 因子 5， 其 幅 值 随 前 置 时 间 的 增加 而 减 小 .打折 后 的 偏差 再 添加 到 
过 程 均值 上 ， 就 得 出 前 置 时 间 为 2 的 预测 . 

以 工业 颜色 属性 时 间 序 列 所 拟 合 的 ARQ) 模型 为 一 数值 示例 ， 图表 7-7 曾 部 分 显示 了 极 
大 似 然 估 计 结 果 ， 而 更 完整 的 结果 见 图 表 9-1. 

图 表 9-1 颜色 序列 AR(1) 模型 的 极 大 似 然 估计 


系数 arl RE 
0. 5705 74. 3293 
5 估计 0. 1435 1. 9151 
oz 估计 值 为 24.8: 对 数 似 然 值 = 一 106.07，AIC= 216.15 
前 已 述 及 这 里 的 截 距 是 y 而 不 是 bo， 


> data (color) 
> ml.color=arima (color,order=c(1,0,0)) 
> ml.color 


出 于 说 明 的 目的 ， 假 设 估计 量 $==0. 5705 和 p=74. 3293 都 是 真实 值 ， 或 可 完善 最 终 的 预测 . 
颜色 属性 的 最 后 一 个 观察 值 是 67， 所 以 向 前 一 期 预测 为 9 
立 (1) = 74.3293 十 (0.5705)(67 一 74.3293) = 74. 3293 — 4. 181366 = 70. 147 93 
对 于 前 置 时 间 2， 从 公式 (9.3.7) 得 到 
(2) = 74. 3293 十 0. 5705(70. 14793 — 74. 3293) = 74. 3293 一 2. 385 472 = 71. 943 83 
另外 ， 还 可 用 公式 (9.3.8) 得 
Y,(2) = 74. 3293 + (0. 5705)2(67 一 74. 3293) = 71. 928 23 


前 置 时 间 为 5 时 ， 有 


O ”因为 伟人 误差 会 累积 起 来 ， 故 选 代 计 算 时 应 当 采 用 小 数 点 后 多 位 小 数 的 形式 . 


Y,(5) = 74. 3293 + (0. 5705)5(67 — 74. 3293) = 73. 886 36 
前 置 时 间 为 10 的 预测 是 
Y,(10) = 74. 302 53 
这 就 非常 接近 p= 74. 3293)， 在 报告 这 些 预测 时 ， 可 能 会 四 舍 五 人 到 最 近 的 小 数位 . 
一 般 说 来 ， 因 为 1$| 二 1， 当 很 大 时 ， 有 如 下 简洁 结果 : 
Y(0) ~p (9. 3. 9) 
将 来 会 看 到 ， 公 式 (9.3.9) 对 所 有 的 平稳 ARMA 模型 都 成 立 . 
现在 考虑 一 步 向 前 预测 误差 e (1)， 从 公式 (9.3.2) 和 公式 (9.3.6) 可 以 得 到 
e(1) = Yui. 一 立 (1) = [$Y,—p) +y ten) — (ey, 一 Ap) +4] 
或 者 
e(l) = en (9, 3. 10) 
现在 可 将 白 噪声 过 程 (e, } 重 释 为 一 步 向 前 预测 误差 序列 ， 下 面 将 看 到 对 普通 ARIMA 模型 ， 均 
有 公式 (9.3.10) R. 还 应 注意 ， 公 式 (9.3.10) 上 暗示 了 预测 误差 e(1) 独立 于 直到 时 间 
的 过 程 的 历史 数据 Y Yo oes Yas Yo 若非 如 此 ， 则 可 利用 相关 性 来 改善 预测 . 
公式 〈9. 3. 10) 还 提示 了 一 步 向 前 预测 误差 的 方差 为 
Var(e,(1)) = ø (9.3.11) 
为 研究 更 长 前 置 期 预测 误差 的 性 质 ， 将 AR(1) 模型 表示 成 一 般 线 性 过 程 或 MA(co) 形式 会 更 
方便 ， 根 据 公 式 (4.3.8), A 
Y, 一 e, 十 g% HPe 十 多 es 十 … (9. 3.12) 
联 立 公式 (9.3.8) 和 公式 (9.3.12), FB 
el) = Ym —p— HCY, — p) = ene thema Hee +H ea + et — Hee + ber 十 ……) 
所 以 
e(l) = ene +H penei teeth ens (9. 3. 13) 
还 可 以 写成 
€,(L) = ene + prenei + peene 十 … + ber eet (9. 3. 14) 
可 证 公式 (9.3.14) 对 所 有 的 ARIMA 模型 都 成 立 〈 见 公式 (9. 3. 430). 
注意 Ee (O)=0; 因此 预测 是 无 偏 的 . 进一步 ， 根 据 公 式 (9. 3. 14)， 有 
Var(e' H) = EA ++ yi +4 +--+.) NED 
可 看 到 ， 随 前 置 时 间 4 的 增加 ， 预 测 误差 的 方差 会 增 大 . 将 该 结果 与 确定 趋势 模型 公式 
(9. 2.4) 所 给 结果 进行 对 比 . 
特别 地 ， 对 AR(1) 情形 ， 通 过 求 几何 级 数 的 有 限 和 得 到 


Var(e,(é)) = dli] (9. 3. 16) 
对 更 长 的 前 置 时 间 ， 有 
Var(e, (4)) ~ r p NRK (9. 3. 17) 


或 者 ， 由 公式 (4.3.3), & 
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Var(e,(4)) œ VarlY,) = yo 对 较 大 的 4 (9. 3. 18) 
可 证 公式 (9.3.18) 对 所 有 平稳 ARMA 过 程 都 成 立 〈 见 公式 (9. 3.399). 
MA(1) 
为 说 明 如 何 解决 请 动 平均 或 混合 模型 预测 时 产生 的 问题 ， 考 虑 有 非 零 均值 的 MA(1)， 
Y, = pte, 一 站 el 
同样 用 :十 1 代替 上， 两 边 取 条 件 期 望 得 


¥,(1) 一 关 一 ge(e| YY Y,) (9. 3. 19) 
但 对 于 可 道 模型 ， 公 式 (4. 5. 2) 表明 e BN, Yoro Y, HARM, MUA 
Eve, |Y, its ore +Y,) — É (9. 3. 20) 


实际 上 ， 由 于 仅 基于 思 Y: ovs Y, 的 条 件 ， 而 不 是 过 程 的 无 穷 多 的 历史 数据 ， 所 以 上 述 公式 
涉及 的 是 一 个 和 逼近 结论 .在 实践 中 ， 如 果 + 上 很 大 ， 且 模型 可 闭 ， 则 鼻 近 误差 将 会 很 小 ， 如 果 模 
型 不 可 道 ， 例 如， 对 数据 过 度 差分 ， 则 公式 (9.3.20) 即便 在 通 近 的 意 交 上 也 不 成 立 ; 见 
Harvey (198lc, 161 H). | 
使 用 公式 (9.3.19) 和 公式 (9.3.20), ATE MAC) 的 一 步 向 前 预测 表达 式 为 
¥,(1) = u— e, (9. 3. 21) 
对 e 的 计算 是 模型 参数 估计 的 副产品 . 
再 次 注意 ， 像 在 公式 (9. 3. 10) 中 一 样 ， 一 步 向 前 预测 误差 是 
eD = Yar ~¥,C)) = lu +H em — 0e) — Cu — he) = em 
从 而 也 可 以 得 出 公式 (9. 3.11). 
对 于 更 长 的 前 置 时 间 ， 有 
PO = pt Eleue|¥isYoo0s¥.) — be Cenei |YrsYors¥,) 
(AS, MCS 1, en Men, 1 都 独立 于 Yi Yoo. Yo AU, CER AREAS 
值 ， 也 就 是 零 ， 故 有 
¥@O=p.t>1 (9. 3. 22) 
HIER. 4 coin, MAC) 情况 下 公式 09.3.9 完全 成 立 ， 既然 在 此 模型 中 一 般 有 内 = 
一 8 和 y= 二 0 G>, AA (9. 3. 14) 和 公式 (9.3.15) 也 成 立 . 


带 漂 移 的 随机 游 动 
为 说 明 非 平稳 ARIMA 序列 的 预测 ， 考 虑 如 下 定义 的 带 漂 移 的 随机 游 动 : 
; Y. = Yı +h +e, (9. 3. 23) 
这 里 ， 
立 (1) = EY, |Y Yl) +H + Elen | Ye ee 
因此 ， 
fd) =Y, +6 (9. 3. 24) 
类 似 地 ， 前 置 时 间 # 预测 的 差分 方程 形式 是 
f =¥,4¢-1)+6&.42>1 (9, 3. 25) 


向 后 迭代 # 步 可 推出 显 式 表 达 式 
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Y,O=Y,+06, Ll (9. 3. 26) 
对 比 公 式 (9.3.99, MRE AO, PAWFRAH 2. MMEK EI LARS, We 
着 一 条 斜率 为 O 的 直线 运动 . 
注意 ， 常 数 项 b 的 存在 与 否 将 会 明显 改变 预测 的 性 质 。 因 此 ， 非 平稳 ARIMA 模型 中 不 
应 该 包含 常数 项 ， 除 非 有 明显 迹象 表明 差分 后 序列 的 均值 明显 异 于 零 . 样本 均值 方差 的 公式 
(3.2.3) 有 助 于 对 该 显著 性 的 评估 . 
然而 ， 正 如 在 ARCO) 和 MA(1) PARAL. 一 步 向 前 预测 误差 是 
ell) = Yai —Y,C)) = em 
并 且 
e, (2) = Y 一 Y,() = (Y, +My Hem tee tug) — CY, +o) = er Fem toe 十 erH 
因为 在 此 模型 中 ， 对 所 有 的 7 了 有 y= 二 1， 所 以 上 式 和 公式 (9.3.14) 一 致 ，( 见 公式 (5.2.6), 
0=0.) 
A, REAR (9. 3. 15) 中 一 样 ， 有 


i 
Var(e,(2)) = 0? Digi = b; | (9. 3. 27) 


与 平稳 序列 情况 相反 ， 这 里 的 Var(e, (O) 随 着 前 置 时 间 刀 的 增加 而 无 限 增 大 .以 后 会 发 现 ， 
这 个 性 质 是 所 有 非 平 稳 ARIMA 过 程 预测 误差 方差 所 共有 的 . 
ARMA(p, q) 
对 一 般 平稳 ARMA(p，g) 模型 ， 计 算 其 预测 的 差分 方程 形式 如 下 : 
FO =h PUD +4, ¥, 0-2) Ho +8, F p) +0 — A Elene |¥i Yous ) 
— Q Elenea | Yu Yast Y) — 0° — OE Cente ,YY Y,) (9. 3. 28) 
其 中 ， 
0 zo 
ej J <0 
eB, WED, VOO 是 真实 的 预测 值 ， 而 对 于 IO, U =Yu;. RAK (9.3.20) 中 
一 样 ， 公 式 (9.3.29) 亦 涉 及 一 些微 小 的 逼近 .对 于 可 逆 模 型 来 说 ， 公 式 4.5.5) 说 明 利 用 
x 权重 ，e 可 以 表示 成 无 穷 序列 了，Y _,，Y_ ，，… 的 线性 组 合 ， 然 而 ，r 权重 快速 指数 衰减 ， 
HRBET 4 j>t—q hf r; 可 和 忽略. 
以 ARMAC, 1) 模型 为 例 ， 有 
PO) = PY, t pe, (9. 3. 30) 


Elen; |Y, sY, 5 a gee = (9. 3. 29) 


和 
¥,(2) = $Y,(1) + 
而 且 ， 更 一 般 地 ， 应 用 公式 (9. 3. 30) 启动 递归 过 程 ， 有 
Y(O=$¢Y,4-V+h, L2 (9. 3. 31) 
可 用 过 程 均值 重 写 公 式 〈9, 3. 30) 和 公式 (9. 3. 31)， 并 先 代 求 得 另外 的 显 式 表达 形式 
YO =pt¢'Y,-p—-¢% le, Ll mene. 3. 32) 
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公式 (9.3.28) 和 公式 (9.3.29) RH, CERT ATTRA 51, 20, qif, REI eu-n, 
e-i e 直接 出 现在 预测 计算 中 . Ai, 4 >q, 将 代 之 以 差分 方程 的 自 回 归 部 分 ， 有 
YO=hY,¢-D+h ¥,¢@—-2+-+4,¥,¢—pt+h, >q (9.3.33) 
因此 ， 长 前 置 时 间 预 测 的 一 般 性 质 取 决 于 自 回归 参数 A. Boe $8。( 以 及 与 过 程 均值 有 关 的 
常数 项 A). 
重 温 公 式 (5.3.2), h= h eh) MEN pe 的 偏离 量 重 写 公式 (9. 3. 33) 
如 下 : 
YO —p=4(¥,4¢—-—)D — u] +ALL’ L2) -—p)] + 
+4¢,[¥,@—p)—-ypl], ¢€>¢@ (9. 3. 34) 
像 过 程 自 相关 函数 wm ( 见 公式 (4.4.8) 一 样 ， 作 为 前 置 时 间 的 函数 ，Y, (4) 一 遵循 相同 的 
Yule-Walker 递归 .因此 , 与 4.3 节 和 4.4 节 中 一 样 ， 特 征 方程 的 根 决定 了 长 前 置 时 间 下 Y,() 一 
4 的 一 般 行 为 ， 特 别 是 ，Y 了 ,4) 一 py 可 以 写成 是 关于 的 指数 衰减 项 〈 对 应 于 实 根 ) 以 及 阻尼 正弦 
波 项 〈 对 应 于 成 对 的 复 根 ) 的 线性 组 合 . 
因此 ， 对 任何 平稳 ARMA 模型 ，Y, (4) 一 随 着 4 的 增加 而 衰减 至 零 ， 长 期 预测 正 是 公式 
(9.3.9) 给 出 的 过 程 均值 x， 这 合乎 常识 ， 因 为 对 平稳 ARMA 模型 来 说 ， 随 着 观察 点 间 时 间 
跨度 的 增 大 ， 其 相关 性 逐渐 消失 ， 而 此 相关 性 是 对 用 yx 所 得 的 “直观 ”预测 可 做 改进 的 唯一 
理由 . 
就 目前 的 一 般 性 而 言 ， 为 讨论 e,(2) 的 公式 (9.3.15) 的 正确 性 ， 需 要 考虑 ARIMA 过 程 
的 一 种 新 的 表达 式 ， 附 录 G 表明 ， 任 何 ARIMA 模型 都 可 写成 如 下 的 截断 线性 过 程 形式 : 


Y me z? CGO +I), > 1l (9. 3. 35) 
其 中 ， 为 当前 的 目的 ， 只 需 明 了 C,@ 是 YY,， Yis wR 4S ph 以 及 
ILL) = eme 十 Pi er- 十 Po Etez Ts + be ert 4 之 1 (9. 3. 36) 


即 可 . 进一步 ， 对 于 可 逆 模 型 ， = i 充分 大 时 ， C, <£) 是 有 限 历 史 数据 Yir fjir Y, 的 某 个 
函数 . 因此 有 
Ñ, (2) = ECC CO |Y, Yo oY.) + EC (A NY Y2 tY) = CO 
最 后 ， 
el = Yu O =(C.O+100)]-CO = 1® 
= ene pherei + prene Hote + bere 
所 以 ， 对 于 一 般 可 逆 ARIMA 过 程 ， 
E[e(O]=0, ¿Èl (9. 3. 37) 
和 
1 
Varle,2)) =o Dives L1 (9. 3. 38) 
j=0 i 
从 公式 (4.1.4) 和 (9.3.8) 可 见 ， 对 长 前 置 时 间 ， 在 平稳 ARMA 模型 中 有 
Var(e, (4)) STON 


j=0 


或 者 


144 £9 


Varle,(2)) = yoo MATAR E (9. 3. 39) 
非 平 稳 模 型 
正如 随机 游 动 所 表明 的 那样 ， 非 平稳 ARIMA 模型 的 预测 与 平稳 ARMA 模型 的 预测 非常 
相似 ， 但 也 存在 一 些 明 显 的 差异 ， 回 顾 人 和 公式 (5, 2.2), ARIMACp, 1. 0) 模型 可 写成 一 个 非 
平稳 ARMA(p 十 1，g) 模型 ， 这 里 写 为 
Y, = pY + pY 十 pY He + pY + Op Yep 
+e, — femi — rEg 一 … — Q€ (9. 3. 40) 
其 中 ， 原 来 的 系数 g 与 系数 上 直接 有 关 ， 特 别 地 ， 
pı 一 l+ og = $ — ioj = 1s2sesp 
Pmi = $p } 
对 于 一 般 的 差分 阶 数 d, MRA ptd 个 g 系数， 
从 该 表达 式 出 发 ， 用 p 十 d 代替 户 ， 并 用 e 代替 $8， 则 可 立刻 扩展 公式 (9.3.28. at 
(9.3.29) 和 公式 (9. 3. 30)， 以 涵盖 非 平稳 的 情形 . 
作为 必要 计算 的 例子 ， 考 虑 ARIMA(1，1，1) 的 情况 ， 这 里 
Y, 一 立 _ = $Y — Y) th He — Oe 


(9. 3.41) 


进而 ， 
Y, = (14+ HY-, — Y: +& +e 一 er 
因此 ， 
(1) = 14+ HY, — +m — Ge, 
ÊD = 0+ ¥,0) —#¥,+% (9. 3. 42) 
Y= 14+9) ¥,¢-1)-#¥,0@-—2) +6 
对 一 般 的 可 道 ARIMA 模型 ， 公 式 (9.3.35) 和 公式 (9.3.36) 给 出 的 截断 线性 过 程 表达 式 及 
依据 公式 进行 的 计算 表明 ， 可 记 为 


Ei (f) = Ey ae fh É+] 十 (he Eite -9 十 AE + Qe Ëi Ti p 1 (9. ae 43) 
从 而 
E(e,(2)) = 0 21 (9. 3. 44) 
和 
-l 
Varle,(2)) =a Digi > 1 (9. 3. 45) 


但 对 非 平 稳 序列 而 言 ， 几 权重 不 会 随 j 的 增加 而 衰减 至 零 ， 比 如 随机 游 动 模型 ， 对 所 有 的 7 有 
J; 二 1; IMAG, D 模型 ,对 j 宇 1 有 册 二 1 一 0; IMA(2，2) RB, Wiel A plte 


— Atl 
9 一)j; 而 对 于 ARGO, D 模型 ， 当 j>1 时 ， 有 y= ( 见 第 5 BE). 


因此 ， 对 任意 的 非 平 稳 模 型 ， 公 式 (9.3.45) 表明 ， 预 测 误差 的 方差 会 随 着 前 置 时 间 4 的 
增加 而 无 限 增 大 .这 一 事实 并 不 太 出 人 意料 ， 因 为 非 平稳 序列 遥远 的 未 来 相当 不 确定 . 
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9.4 预测 极限 


如 同 所 有 的 统计 工作 一 样 ， 除 了 预测 或 者 预言 未 知 的 Y,;,， 人 们 还 关注 对 预测 精确 度 的 
评估 . 

确定 性 趋势 

对 有 白 噪 声 随 机 项 (X) 的 确定 性 趋势 模型 ， 前 已 述 及 

Y, (2) 一 Hre 
和 
Var(e,(4)) = Var(X me) = Yo 

如 果 随 机 项 是 正 态 分 布 ， 那 么 预测 误差 


ell) = Ym — D = Xm (9. 4. 1) 
也 是 正 态 分 布 ， 故 对 给 定 的 置信 水 平 1 一 xc， 可 用 标准 的 正 态 百 分 位 数 z-a HER 
Yue —yY (L) 
了 | 一 zia < 一 一 一 > 一 1 一 
[an J i 


或 者 等 价 地 
PLY, (0) — zia VVarCe ll)) < Yue < Ô, (O + zian /Varle,(2))] = 1—a 
因此 ， 未 来 观察 值 Y,;, 落 于 如 下 预测 极限 内 的 可 信和 度 是 (1 一 a)100%; 
YO E ziza VVarle(l)) SO (9. 4. 2) 

作为 一 个 数值 示例 ， 再 次 考虑 月 度 平均 气温 序列 .在 9. 2 节 最 后 ， 使 用 余弦 模型 预测 
1976 年 6 月 的 平均 气温 是 68. 3 下 该 模型 /Varle, O) = VN。 的 估计 值 是 3. 7 下， 因此 ，1976 
年 6 月 平均 气温 95% 可 信 度 的 置信 区 间 是 

68. 3+1. 96(3. 7) = 68. 3 +7. 252 W 61. 05°F ~ 75. 55°F 

熟悉 标准 回归 分 析 的 读者 能 够 想起 ， 既 然 预 测 涉及 了 回归 参数 的 估计 值 ， 那 么 真实 的 预测 
误差 方差 即 为 yp[1 十 (1/n) 十 cw]， 其 中 cv 是 样本 容量 ”和 前 置 时 间 的 函数 . 然而， 对 所 考 
察 的 几 种 趋势 类 型 (即时 域 的 余弦 和 多 项 式 ) 和 大 样本 容量 n, 或 可 证 明 相对 于 1 来 说 ，1/n 
和 c,, 都 是 微不足道 的 ， 比如， 在 N=n/12 年 中 ， 有 周期 12 的 余弦 趋势 ， 则 有 cne =2/n; A 
此 正确 的 预测 误差 方差 是 yx[1 十 (3/z)?]， 而 非 近似 值 yx 对 于 线性 趋势 模型 ， 对 中 等 大 小 的 
前 置 时 间 & 和 大 样本 容量 mw， 可 证 c,,,=3(n+2l—1)*/[n(r’? —-1))=3/n. 因此， 近似 值 看 似 再 
次 被 证 实 是 合理 的 . 

ARIMA 模型 

如 果 在 一 般 ARIMA 模型 中 ， 白 噪声 (e) 独立 地 来 自 某 正 态 分 布 ， 那 么 根据 公式 
(9.3.43) 可知 ， 预 测 误差 e) 也 会 有 正 态 分 布 ， 导 向 公式 (9.4.2) 的 步骤 仍然 可 行 . 但 对 
比 确定 性 趋势 模型 ， 忆 及 当前 情况 下 


Var(e,(4)) = o Sy 
在 实际 中 ，o? 未 知 ， 需 要 用 观察 到 的 时 间 序 列 来 估计 .必要 的 少 权重 当然 也 是 未 知 的 ， 因 其 是 
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未 知 的 上 和 6 的 函数 .对 大 样本 容量 ， 这 些 估 计量 对 上 述 真实 的 预测 极限 不 会 有 多 少 影 响 ， 
以 对 工业 颜色 属性 序列 估计 的 ARG) 模型 为 数值 示例 .在 图 表 9-1 中 ， 采 用 % 一 0. 5705， 
u=74. 3293 Alo =24.8. 对 ARC) 模型 ， 忆 及 公式 (9.3.16) 


Var(e,(Z)) = ot] | 


一 步 问 前 预测 是 
70. 147 93 + 1. 96 V24. 8 = 70. 147 93 + 9. 760 721 或 60.39 一 79.91 


二 步 向 前 预测 是 
71. 860 72 + 11. 883 43 或 60.71 ~ 83. 18 


注意 这 一 预测 区 间 比 先前 的 预测 区 间 大 ， 对 十 步 向 前 预测 ， 得 到 
74. 173 934 + 11. 884 51 或 62.42 ~ 86. 19 


在 前 置 时 间 10 之 前 ， 预 测 及 预测 极限 都 已 稳定 在 其 长 前 置 时 间 值 上 . 


9.5 预测 的 图 示 
与 列举 预测 和 预测 极限 的 计算 过 程 不 同 ， 恰 当 绘 制 预测 和 预测 极限 的 图 形 往往 更 有 指导 意义 . 


确定 性 趋势 
图 表 9-2 显示 了 月 平均 气温 序列 最 近 四 年 和 后 续 两 年 的 预测 及 95 为 的 预测 极限 .因为 模型 
拟 合 得 非常 好 ， 只 有 相对 很 小 的 误差 方差 ， 所 以 预测 极限 也 非常 接近 于 拟 合 趋势 的 预测 . 


图 表 9-2 气温 序列 余弦 趋势 的 预测 及 其 极限 


1972 1973 1974 1975 1976 1977 1978 
年 份 


> data (tempdub) 

> tempdubl=ts (c(tempdub, rep (NA, 24)),start=start (tempdub), 
freq=frequency (tempdub) ) 

har. =harmonic (tempdub, 1) 

m5. tempdub=arima (tempdub, order=c(0,0,0) ,xreg=har. ) 

newhar.=harmonic(ts(rep(1,24), start=c (1976,1) ,freq=12) ,1) 

win.graph (width=4.875, height=2.5,pointsize=8) 

plot (m5.tempdub,n.ahead=24,n1l=c(1972,1) ,newxreg=newhar., 
type='b',ylab='Temperature' ,xlab='Year' ) 


a Ae 
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ARIMA 模型 
以 工业 颜色 属性 序列 为 ARIMA 预测 的 第 一 个 图 例 . 图 表 9-3 示 出 了 该 序列 及 其 前 置 12 


期 的 预测 ， 以 及 上 下 95% 的 预测 极限 . 此 外 ， 也 给 出 了 过 程 均 值 估 计量 所 在 的 水 平 线 ， 注意， 
预测 是 如 何 随 前 置 时 间 的 增加 而 指数 地 趋向 均值 的 ， 以 及 预测 极限 的 宽度 是 如 何 增加 的 . 


图 表 9-3 颜色 序列 AR(1) 模型 的 预测 及 其 极限 


颜色 属性 


> data (color) 
> ml.color=arima(color,order=c(1,0,0)) 
> plot (ml .color,n.ahead=12,type='b' ,xlab='Time', 
ylab='Color Property') 
> abline (h=coef (ml .color) [names (coef (m1.color))=='intercept']) 


根据 加 拿 大 野兔 丰 度 序列 取 值 的 平方 根 拟 合 一 个 AR(3) 模型 .注意 在 图 表 9-4 中 ， 当 预 
测 的 前 置 期 取 到 25 年 时 ， 预 测 是 如 何 模拟 实际 序列 中 的 渐 近 周期 的 . 


图 表 9-4 野兔 丰 度 平方 根 序 列 AR(3) 模型 的 预测 


野 免 丰 度 平方 根 


1910 1920 1930 1940 1950 1960 


> data (hare) 

> ml.hare=arima (sqrt (hare) ,order=c(3,0,0)) 

> plot (m1.hare, n.ahead=25,type='b', 
xlab='Year',ylab='Sqrt (hare) ') 

> abline (h=coef (m1.hare) (names (coef (m1.hare))=='intercept'] ) 


9.6 ARIMA 预测 的 更 新 


假设 预测 一 个 月 度 时 间 序 列 ， 例 如 ， 最 末 观 察 值 是 2 月 份 数据 ， 我 们 预测 3 月 份 、4 月 份 
和 5 月 份 的 数值 .随时 间 的 流逝 ，3 月 份 的 真实 数值 将 可 以 获得 ， 基 于 这 个 新 获得 的 数值 ， 就 
会 产生 更 新 或 修正 (希望 能 够 改善 ) 4 月份 、5 月 份 预测 的 想法 . 当然 ， 也 可 以 从 头 开 始 计算 
新 的 预测 ， 但 存在 更 简便 的 方法 . 

对 于 一 般 的 预测 起 点 上 和 前 置 时 间 上 十 1， 原 始 的 预测 是 Y,(t 十 1)， 一旦 得 到 :十 1 期 的 观察 
值 ， 读 者 就 会 有 意 将 预测 更 新 至 立 ,,(b). 由 公式 (9.3.35) 和 公式 (9.3.36) 得 

Ye = CUF 1) F enei F pene F penei t'e 十 e+H 
既然 C.G¢-+1) 和 e,+1 是 Yitis Yoo … 的 函数 ， 而 Eteri’ Crees?» e+ 又 独立 于 Yii o Vy pees 
则 可 很 快 地 推导 出 下 式 : 
YO = CC 十 1) + hens 
然而 , Y.¢+1) =C,(¢+1) 并 且 显 然 有 ei:1 二 Yt+1 一 了 (1)， 因此 一 般 的 更 新 方程 是 
VO =P UHD HAY A] (9.6.1) 

+e, —ABAWRAY.1, BA [Y,+1 一 了 ,(1)] 就 是 上 十 1 期 真实 的 预测 误差 ， 

以 工业 颜色 属性 的 时 间 序 列 为 数值 示例 .根据 图 表 9-1， 拟 合 一 个 AR(1) 模型 来 预测 前 
置 一 期 的 值 为 多; (1) = 二 70. 147 57， 前 置 二 期 的 值 为 了 , (2) 二 71. 943 42， 如 果 获 得 了 下 一 期 的 颜 
色 值 为 Y,,1 =Y = 二 65， 那 么 更 新 :二 37 的 预测 值 

Y..,(1) = Ê, (1) = 71. 943 42 十 0. 5705(65 — 70. 147 57) = 69. 006 73 


9.7 ”预测 的 权重 与 指数 加 权 滑 动 平 均 


对 无 滑动 平均 项 的 ARIMA 模型 ， 很 清楚 如 何 自 观 测序 列 Y,，Y-:，…，Y 得 出 预测 .但 
对 于 g>0 的 任何 模型 ， 预 测 中 都 会 出 现 品 声 项 ， 且 以 YY，Y -mi 显 式 表 出 的 预测 特性 也 
隐 而 不 显 ， 为 刻画 预测 的 这 一 面 ， 需 回 到 任 一 可 关 ARIMA 过 程 的 逆转 形式 上 ， 即 

Y, 一 XIY_ F reY HRY Fel +e 
(见方 程 (4.5.5).) 因此 ， 上 式 还 可 以 写成 
You, = mY, + aY i t mY o t Ml 一 本 站 
wey, Yi Yi， 两 边 同 时 取 条 件 期 望 得 
立 (1) = mY, 十 raY H mY st (9. 7. 1) 
GX HUBS t EEKMA r 权重 变 小 得 足够 快 ， 以 至 于 mo mii MASAI.) 
任意 可 逆 ARIMA BAH ce MR, WA FREER: 


mint) sg) 
>) Oni + 9; lesac.pra 
wh (9. 7. 2) 


Wy min(j ,9) 


pS ON ji j>prtd 
初 值 m 王 一 1. OO HR yy 权重 的 方程 组 (4. 4. 7).) 
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特别 地 ， 考 虑 非 平稳 IMAC], 1) 模型 

Y, = ¥ He, — hen 
这 里 p=0, d=1, q=l, H p51; 因此 

m =—@xrtl=1-@ 

t: = Öz, = 01 — 0) 
且 一 般 地 有 

fi = Prj- > 1 

故 有 显 式 

mi = (1—00, j >1 (9.7.3) 
因此 ， 由 公式 (9.7. D 可 以 写 出 

fD = (DY + DFY,; + (9. 7. 4) 
这 里 ，r 权重 指数 递减 ， 进 一 步 
Dn = (1-8) je = 和 =1 


j=l j=l 


因此 ， 称 多 (1) 为 指数 加 权 滑 动 平均 CEWMA). 
简单 代数 运算 表明 ， 上 式 还 可 写成 
Y,(1) = (1— WY, +0Y?,,(1) (9.7.5) 

和 

f.a) = fo (1) 十 (一作 [Y, 一 立 01) (9. 7. 6) 
公式 (9.7.5) 和 公式 (9.7.6) 说 明了 如 何 根据 从 起 始点 i 一 1 到 :的 变化 来 更 新 预测 ， 而 且 结 
果 可 表述 为 新 观察 值 和 过 去 预测 值 的 线性 组 合 ， 或 者 是 过 去 预测 值 及 上 一 个 观察 到 的 预测 误 善 
的 线性 组 合 . | 

SEN, -HAAR/AM A EWMA 进行 时 间 序 列 预测 ， 通常 是 基于 需要 提出 ， 参 见 
Brown (1962), Montgomery 和 Johnson(1976). 

在 有 关 EWMA 的 文献 中 ， 参 数 1 一 0 称 为 平滑 常数 ， 其 选择 (估计 ) 往往 很 随意 .根据 
ARIMA 建 模 的 过 程 ，IMA(1，1) 是 否 适 合 序 列 是 由 数据 决定 的 ， 如 果 适 合 ， 则 给 出 的 有 效 
估计 并 计算 EWMA 预测 ， 可 以 确信 该 现 测 即 是 最 小 均 方 误差 预测 . 对 指数 滑动 更 深信 的 研究 
及 其 与 ARIMA 模型 的 关系 ， 和 参见 Abraham 和 Ledolter(1983). 


9.8 变换 序列 的 预测 


差分 
假设 对 模型 经 一 次 差分 后 平稳 的 序列 的 预测 感 兴趣 ， 可 考虑 的 预测 方法 有 两 种 : 
1. 预测 初始 的 非 平稳 序列 ， 比 如 应 用 公式 (9. 3. 28) 的 差分 方程 形式 ， 用 p 代替 其 中 


H) $. 
2. 预测 差分 后 的 平稳 序列 W, 二 Y, 一 Y,!， 再 加 总 所 得 的 差分 来 得 出 原 序列 的 预测 . 
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可 以 证 明 两 种 方法 所 得 预测 一 致 . 本 质 原因 在 于 差分 是 一 个 线性 运算 ， 并 且 线 性 组 合 的 条 
件 期 望 和 条 件 预 期 的 线性 组 合 相同 . 
特别 地 ， 考 虑 IMAC, 1) 模型 . 基于 对 原 非 平稳 序列 已 做 的 工作 ， 预 测 为 


Y,(1) = Y, —@e, (9, 8. 1) 
和 
立 (bb) =, 4—1) £>1 (9. 8. 2) 
现在 考虑 差分 后 的 平稳 MA(1) FI W, =Y, —Y.. 预测 WA 
W,(1) =— ĝe, (9. 8. 3) 
和 
W.O=0 4>1 (9. 8. 4) 


Ri. WDP, DY, 因此 和 之 前 一 样 俯 ,(1) = 二 一 9e, 等 价 于 Y COSY, — 0e. XU, 
w, (4) 二.(4) 一 了 (一 1)， 恰 如 所 述 ， 公 式 (9. 8. 4) 变 为 公式 (9. 8. 2). 

同样 的 结论 适用 于 包含 任意 阶 差 分 的 任何 模型 ， 事 实 上 也 适用 于 带 常 系数 的 任何 线性 变 
He. (差分 以 外 的 某 些 线性 变换 可 能 适用 于 季节 性 时 间 序 列 ， 见 第 10 章 . ) 

对 数 变换 | 

如 前 所 述 ， 对 原始 序列 取 对 数 后 的 序列 建 模 很 常见 一 一 这 是 一 种 非 线 性 变换 . 令 Y, 代表 
原始 序列 值 ，Z, 二 log(Y,)， 可 以 证 明 总 是 有 

a PM a a we EZ ZZ) (9. 8. 5) 
等 式 仅 在 很 少 情况 下 成 立 ， 因 此 ， 简 单 的 预测 explZ,(2)] 并 非 了 ,1 的 最 小 均 方 误差 预测 .在 
用 原始 项 评估 最 小 均 方 误差 预测 时 ， 下 述 事实 会 有 用 : WRX RASE a, FHS 的 正 态 分 
Ai. BBA 
E[exp(X)] = expla 十 Z] 


(比如 ， 可 由 X KERRE.) 在 这 里 
p = E( Zee (Ze Zes) 
H 
o = Var(Z, |Z.: Zm t) 

= Var[ (e 十 CC |Z Zm] 

= Var[ (e0) | Z: s Zei 3% Z1] + VarlC, (2) | Z: Zm 9° Zi J 

= Var[ (e (0 | Z. ,Z 2 J 

= Var[ (e,( | 
上 式 得 自 公 式 (9.3.35) MAR (9.3.36) (用 于 Z) 及 如 下 事实 ; CO HZ. Zis oH 
函数 ， 而 e (Cl) 独立 于 Zo Zas e. 因此 ， 原 始 序 列 中 的 最 小 均 方 误 差 预测 给 出 如 下 : 


exp{Z,(0 F 5 Varle, ol (9. 8. 6) 


以 最 小 均 方 误差 为 选择 的 标准 ， 贯 穿 于 有 关 预 测 的 全 部 讨论 中 .该 标准 对 于 正 态 分 布 变量 而 言 
非常 好 ， 而 如 果 Z 有 正 态 分 布 ， 那 么 ,二 exp(2.) 具有 对 数 正 态 分 布 ， 这 时 可 能 更 宜 采 用 男 
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外 的 标准 . 特别 地 ， 既 然 对 数 正 态 分 布 不 对 称 ， 且 有 很 长 的 右 拖 尾 ， 则 基于 均值 绝对 误差 的 标 
准 可 能 更 合适 ， 该 标准 下 ， 最 优 预 测 是 在 条 件 Zo Zaos Z 下 Z+ 分布 的 中 位 数 ， 因 为 对 


数 变 换 保 留 了 中 位 数 ， 以 及 正 态 分 布 的 均值 和 中 位 数 相等 ， 所 以 在 均值 绝对 预测 误差 最 小 的 意 
义 上 ， 简 单 的 预测 expl, A] BY. HREM. 


99 He ARIMA 模型 预测 的 总 结 
这 里 我 们 展示 几 种 不 同 的 特殊 ARIMA 模型 的 预测 结果 . 
AR(1): Y,=pe+8(¥,-1—p) +e, 
YO =pt+¢l¥y,¢-D)—pl]é>1 
= u+ # (Ê, — p) Ll 
Y,(£) ~ ,对 较 大 的 
elf = eure H Penei foe tH en 


Varle,(2)) = ó f =o) 


Varte,(0)) ~ zy = Yo RAIN 4 


dp =P j> 
MA ( 1 ) t Y, =u Fe, — ĝem 


Y,(1) =p- ĝe, 
f(D =pl 


e(l) = e 
e (D = ene — Oen > 1 
Vartle,(#)) = are 
| 中 (1 十 多 ) >l 
一 上 一 1 
ee fi Jal 


带 常 数 项 的 IMA(1, 1): Y, =Y, F teie 
¥@) = ¥,¢-—1)+& —be, =Y, +60. — be, 
Vd) = (Q—-MY,+0-O0Y.+ 0-OY,, + -CEWMA . & = 0) 
e(l) = eme tO — Menges +O Oen Fe $1 — Men fl 
Varle,(2)) = &(1+4¢-Da—-#’] 
y; =1-—0,j7 >0 
注意 ， 如 果 久 关 0， 预 测 会 沿 着 一 条 斜率 为 0 的 直线 ,但 车 和 一 0 〈 此 种 情况 常见 )， 则 对 于 所 
有 前 置 时 间 预 测 都 相同 ， 也 就 是 
Y,(2) =Y,—6e, 
IMA(2, 2): Y, =2Y 1 Y,- TO er — ie- ~ze: 
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Y,(1) = 2Y, — Yı th — the, — rer, 
Y¥,(2) = 2¥,01) —Y, +6 — the, (9.9.1) 
f,O =2Y¥,4¢-D-¥,4¢-244.4>2 
多 (CO =A4 Be+ Se (9. 9. 2) 
其 中 
A=2Y,0)-¥,(9 +4 (9.9.3) 
A 
B=Y,(2) —¥Y,(1) 一 $6. (9.9.4) 


如 果 如 关 0， 预 测 会 沿 着 一 条 关于 4 的 二 次 曲线 ， 而 车 名 二 0， 预 测 是 一 条 斜率 为 了 (2) 一 Y,(1) 
的 直线 ， 且 过 两 个 初始 预测 点 (1) 和 YY,(2)， 可 证 Var(e, (4)) 是 4 的 三 次 函数 ; 见 Box, 
Jenkins 和 Reinsel(1994, 156 W). 还 有 

p =1+&+0—-6—&)7 7 >0 (9.9.5) 
还 可 证 明 ， 在 处 二 2w Mo =w 的 特殊 情况 下 ， 序 列 的 预测 等 价 于 带 平滑 常数 1 一 的 所 请 双 
指数 平滑 ; 见 Abraham 和 Ledolter(1983). 


9.10 小 结 


对 未 来 尚未 观察 的 量 进 行 预测 或 预报 ， 是 建立 时 间 序 列 模型 的 主要 原因 之 一 ， 本章 所 讨 
论 的 方法 ， 均 基于 最 小 化 的 均 方 预测 误差 . 当 模 型 为 简单 的 确定 性 趋势 加 上 零 均值 白 品 声 
时 ， 预 测 即 等 同 于 外 推 趋势 .而 当 模 型 包含 自 相 关 关 系 时 ， 充 分 利用 相关 性 将 有 助 于 得 出 更 
好 的 预测 . 本 章 通过 ARMA 模型 展示 了 这 一 点 ， 并 研究 了 有 关 预 测 的 计算 和 性 质 ， 特 殊 情 
况 下 ， 预 测 的 计算 和 性 质 别 有 意 味 ， 因 而 单独 予以 描述 ， 在 评 佑 隐 含 的 预测 精确 度 〈 或 相 
E) 时 ， 预 报 极限 特别 重要 . 最后， 引申 论述 了 包含 原始 序列 变换 模型 的 时 间 序 列 预 测 
问题 . 


习题 
9.1 WARC) MERI, Y,=12.2, ¢=—0.5, u=10.8. 
(a) 求 芯 (1)， 
(b) 用 两 种 不 同 的 方式 计算 立 (2). 
(c) 计算 (10). 
9.2 假定 Acme 公司 的 年 销售 额 CA: 百 万 美元 ) 符合 AR(2) 模型 Y= 二 5 十 1.1Y,-1 一 
0. 5Y; te, HP t= l 
(a) 如 果 2005 Æ., 2006 年 和 2007 年 的 销售 额 分 别 是 900 万 、1100 万 和 1000 万 美元 ， 
预测 2008 年 和 2009 年 的 销售 额 ， 
Cb) 证 明 模 型 里 的 gp =l. 1. 
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Co) 计算 问题 Ca) 中 2008 年 预测 的 95% 预 测 极 限 . 

(d) 如 果 2008 年 的 销售 额 结 果 为 1200 万 美元 ， 更 新 对 2009 年 的 预测 . 

使 用 9. 2 节 最 后 所 估计 的 余弦 趋势 ， 

Ca) 预测 1976 Æ 4 HRH Dubuque 市 的 月 平均 气温 . 

(b) 求 该 月 预测 的 95% 置 信 区 间 . (模型 Vy, 的 估计 量 是 3. 719°F). 

(c) 1977 年 4 月 、2009 年 4 月 的 预测 值 各 是 多 少 ? 

使 用 9.2 节 最 后 所 估计 的 余弦 趋势 

Ca) 预测 1976 年 5 ARTH Dubuque 市 的 月 平均 气温 . 

(b) 3È 1976 年 5 月 预测 值 的 95 昕 置信 区 间 .〈 模 型 V7 的 估计 量 是 3. 719 下 )， 

使 用 图 表 3-3 中 没有 截 距 项 的 季节 均值 模型 : 

Ca) 预测 1976 Æ 4 HERH Dubuque 市 的 月 平均 气温 . 

(b) 求 4 月 预测 的 95 上 置信 区 间 . 〈 模 型 7m 的 估计 量 是 3. 419°F ). 

(c) 与 习题 9. 3 所 得 结果 进行 比较 . 

(Cd) 1977 年 4 月 、2009 年 4 月 的 预测 值 各 是 多 少 ? 

使 用 图 表 3-4 中 有 截 距 项 的 季节 均值 模型 ， 

(a) 预测 1976 Æ 4 AEM Dubuque 市 的 月 平均 气温 . 

(b) 求 4 月 预测 的 95% 置 信 区 间 ，( 模 型 Vy 的 估计 量 是 3. 419 下 ). 

Cc) 与 习题 9.5 所 得 结果 进行 比较 . 

使 用 图 表 3-4 中 有 截 距 项 的 季节 均值 模型 ，; 

(a) 预测 1976 年 1 月 艾 奥 瓦 州 Dubuque 市 的 月 平均 气温 . 

(b) 求 1 月 预测 的 95%% 置 信 区 间 . (模型 Vy 的 估计 量 是 3. 419 下 ). 

考虑 图 表 5-8 中 的 月 度 发 电量 时 间 序 列 ， 数 据 文档 名 为 electricity. 

(a) 为 发 电量 的 对 数 序列 拟 合 一 个 模型 ， 模 型 包含 季节 均值 的 确定 性 趋势 ， 同 时 还 有 线 
性 时 间 趋 势 . 

(b) 画 出 过 去 5 年 和 未 来 2 年 预测 的 序列 图 ， 以 及 95% 预 测 极限 ， 并 给 出 解释 , 

模拟 一 个 $= 二 0.8， p=100 的 ARC) 过程 ， 模拟 48 个 值 ， 但 将 最 后 的 8 个 值 搓 置 起 来 ， 

以 对 预测 值 与 真实 值 进行 比 较 . 

Ca) 使 用 序列 前 40 MA. ORO Al 的 极 大 似 然 估计 的 值 ， 

(b) 使 用 所 估计 的 模型 预测 序列 接 下 来 的 8 个 值 ， 并 画 出 带 这 8 个 预测 值 的 序列 .在 
估计 的 序列 均值 上 画 一 条 水 平 线 ， 

(c) 将 8 个 预测 值 与 前 面 搁 置 的 真实 值 进行 比较 . 

(d 通 出 预测 及 其 95% 预 测 极限 ， 真 实 值 是 否 落 人 预测 极限 的 区 间 ? 

(e) 用 同样 的 参数 值 和 相同 的 样本 容量 ， 模 拟 一 个 新 的 序列 ， 并 重复 Ca) 到 Cd. 


10 #4 ¢,=1.5, %=—0.75, p=100 的 AR(2) 过 程 . 模拟 52 个 值 ， 但 将 最 后 的 12 个 


值 搁置 起 来 ， 以 对 预测 值 与 真实 值 进行 比较 . 
(a) 使 用 序列 前 40 ME, R o A y 的 极 大 似 然 售 计 值 . 
(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 12 个 值 ， 并 画 出 带 这 12 个 预测 值 的 序列 . 
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9. 14 


4 fH it AY Fe S EA E m a RK RR. 

Cc) 将 12 个 预测 值 与 所 留 出 的 真实 值 进 行 比 较 . 

(d) 画 出 预测 及 其 95% 预 测 极限 ， 真 实 值 是 否 莫 入 预测 极限 的 区 间 ? 

(e) 用 同样 的 参数 值 和 相同 的 样本 容量 ， 模 拟 一 个 新 的 序列 ， 并 重复 Cad 到 d). 

模拟 O=0.6, »=100 的 MAGO) 过 程 . 模拟 36 个 值 ， 但 将 最 后 的 4 个 值 搁置 起 来 ， 以 

对 预测 值 与 真实 值 进行 比 较 . 

Ca) 使 用 序列 前 32 MB. ORO Aly 的 极 大 似 然 估计 值 ， 

Cb) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 4 个 值 ， 并 画 出 带 4 个 预测 值 的 序列 ， 在 估 
计 的 序列 均值 上 画 一 条 水 平 线 . 

Cc) 将 4 个 预测 值 与 所 留 出 的 真实 值 进行 比较 . 

(d 画 出 预测 及 其 95% 预 测 极 限 ， 真 实 值 是 否 落 入 预测 极限 的 区 间 ? 

Cc) 用 同样 的 参数 值 和 相同 的 样本 容量 ,模拟 一 个 新 的 序列 ， 并 重复 Ca) 到 Cd). 

模拟 = 王 1， 凡 = 一 0.6，An 一 100 的 MAC2) 模型 .模拟 36 个 值 ， 但 将 最 后 的 4 个 值 搓 

置 起 来 ， 以 对 预测 值 与 真实 值 进 行 比较 . 

(a) 使 用 序列 前 32 MA, RO Ap 的 极 大 似 然 估计 值 . 

(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 4 个 值 ， 并 画 出 带 4 个 预测 值 的 序列 .在 估 
计 的 序列 均值 上 画 一 条 水 平 线 ， 

(c) 前 置 时 间 为 3 和 4 的 预测 值 有 什么 特别 之 处 吗 ? 

Cd) 将 4 个 预测 值 与 所 留 出 的 真实 值 进行 比较 ， 

(e) 画 出 预测 及 其 95%% 预测 极限 ， 真 实 值 是 否 落 人 预测 极限 的 区 间 ? 

Cf) 用 同样 的 参数 值 和 相同 的 样本 容量 ,模拟 一 个 新 的 序列 ， 并 重复 (a) 到 Ce). 

模拟 $= 二 0.7，9== 一 0.5， 二 100 的 ARMA(1，1) 模型 .模拟 50 个 值 , 但 将 最 后 的 10 

个 值 搁置 起 来 ， 以 对 预测 值 与 真实 值 进行 比较 . 

(a) 使 用 序列 前 40 MA. ORO. OM 的 极 大 似 然 估计 值 . 

(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 10 个 值 ， 并 画 出 带 10 个 预测 值 的 序列 ， 在 
估计 的 序列 均值 上 画 一 条 水 平 线 . 

(c) 将 10 个 预测 值 与 所 留 出 的 真实 值 进 行 比 较 . 

(d 画 出 预测 及 其 95% 预 测 极限 ， 真 实 值 是 否 落 人 预测 极限 的 区 间 ? 

(e) 用 同样 的 参数 值 和 相同 的 样本 容量 ， 模 拟 一 个 新 的 序列 ， 并 重复 (a) 到 (qd). 

模拟 g=0.8， 册 =0 的 IMAC, 1) 模型 .模拟 35 个 值 ， 但 将 最 后 的 5 个 值 搁置 起 来 ， 

以 对 预测 值 与 真实 值 进行 比较 . 

(a) 使 用 序列 前 30 个 值 ， 求 8 的 极 大 似 然 估 计 值 . 

(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 5 个 值 ， 并 画 出 带 5 个 预测 值 的 序列 这些 
预测 值 有 什么 特殊 之 处 吗 ? 

(c) 将 5 个 预测 值 与 所 留 出 的 真实 值 进行 比较 . 

(d) 画 出 预测 及 其 95% 预 测 极限 .真实 值 是 否 落 入 预测 极限 的 区 间 ? 

(e) 用 同样 的 参数 值 和 相同 的 样本 容量 ， 模 拟 一 个 新 的 序列 ， 并 重复 Co 到 Cd. 

模拟 @=0.8, O=10 W IMAC, D 模型 .模拟 35 个 值 ， 但 将 最 后 的 5 个 值 搁置 起 来 ， 
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以 对 预测 值 与 真实 值 进行 比较 . 

(a) 使 用 序列 前 30 SE. OR 6 AO, 的 极 大 似 然 估计 值 . 

(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 5 个 值 ， 并 画 出 带 5 个 预测 值 的 序列 这些 
预测 值 有 什么 特殊 之 处 吗 ? 

Co) 将 5 个 预测 值 与 所 留 出 的 真实 值 进 行 比较 . 

(d) 画 出 预测 及 其 95%% 预 测 极限 ， 真 实 值 是 否 落 人 预测 极限 的 区 间 ? 

(e) 用 同样 的 参数 值 和 相同 的 样本 容量 ,模拟 一 个 新 的 序列 ， 并 重复 (a) 到 Cd). 

EHL g =1, ,二 一 0.75 A a =0 的 IMA(2，2) 模型 .模拟 45 个 值 ， 但 将 最 后 的 5 个 

值 搁置 起 来 ， 以 对 预测 值 与 真实 值 进行 比较 . 

(a) 使 用 序列 前 40 MA. RO, AO, 的 极 大 似 然 估计 值 . 

(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 5 个 值 ， 并 画 出 带 5 个 预测 值 的 序列 ， 这 些 
预测 值 有 什么 特殊 之 处 吗 ? 

Cc) 将 5 个 预测 值 与 所 留 出 的 真实 值 进行 比较 . 

(d 画 出 预测 及 其 95% 预 测 极 限 ， 真 实 值 是 耕 落 人 预测 极限 的 区 间 ? 

Cc) 用 同样 的 参数 值 和 相同 的 样本 容量 ， 模 拟 一 个 新 的 序列 ， 并 重复 Ca) 到 Cd). 

假设 有 .=1， ,二 一 0.75 Ald =10 的 IMA(2，2) 模型 .模拟 45 个 值 ， 但 将 最 后 的 5 

个 值 搁置 起 来 ， 以 对 预测 值 与 真实 值 进 行 比 较 . 

(a) 使 用 序列 前 40 TTA. RO. O MO 的 极 太 似 然 估计 值 . 

(b) 使 用 所 估计 的 模型 ， 预 测序 列 接 下 来 的 5 个 值 ， 并 画 出 带 5 个 预测 值 的 序列 .这些 
预测 值 有 什么 特殊 之 处 吗 ? 

Cc) 将 5 个 预测 值 与 所 留 出 的 真实 值 进 行 比 较 ， 

(d) 画 出 预测 及 其 95% 预 测 极限 ， 真 实 值 是 否 薄 人 预测 极限 的 区 间 ? 

(e) 用 同样 的 参数 值 和 相同 的 样本 容量 模拟 一 个 新 的 序列 ， 并 重复 Ca) 到 d). 

考虑 模型 Y, 一 册 十 Bi 十 和 ， 其 中 和 S= 4X +e. PEA, AAPEA. RENE H 

的 最 小 均 方 误差 预测 可 写成 立 (bl) =p +a atO Y, S eet. 

验证 公式 (9. 3. 16)， 

验证 公式 (9. 3. 32). 

名 为 deere3 的 文档 里 有 来 自 Deere&Co. 公司 的 某 复 杂 机 床 过 程 的 57 个 连续 的 值 ， 记 录 

的 是 相对 目标 值 的 偏离 量 ， 单 位 是 于 万 分 之 一 英尺 ， 该 过 程 采 用 的 控制 机 制 为 ,根据 上 

一 件 产品 偏离 目标 值 的 幅度 ， 来 重 置 该 机 床 的 某 些 参 数 . 

(a) 对 此 序列 应 用 ARC) 模型 ， 预 测 接 下 来 的 10 个 值 . 

(b) 画 出 该 时 间 序 列 、 预 测 值 以 及 95 吕 预测 极限 的 图 ， 并 解释 结果 . 

名 为 days 的 文档 里 有 来 自 艾 奥 瓦 州 伯 灵 顿 市 Winegard 公司 的 会 计数 据 ， 记 录 了 了 Wine 

gard 收 到 某 承销 商 130 个 连续 订单 后 到 款 的 天 数 . 〈 出 于 保密 原因 ， 隐 匿 该 承销 商 的 名 

字 .) 由 图 可 见 ， 该 时 间 序 列 包含 了 一 些 明 显 的 异常 值 ， 用 典型 值 35 天 来 代替 在 “时 

点 ”63、106 和 129 上 的 每 一 个 异常 值 . 

(a) 对 此 修正 序列 应 用 MA(2) 模型 ， 预 测 接 下 来 的 10 个 值 . 
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(b) BAG NT TLRS, EAR 95% 预 测 极 限 的 图 ， 并 解释 结果 . 

9.23 文档 robot 中 的 时 间 序 列 数据 给 出 了 某 工 业 机 器 人 完成 一 系列 预 设 的 工作 之 后 ， 在 工 轴 
上 的 最 终 位 置 ， 相 对 于 目标 位 置 的 偏离 量 作为 测量 对 象 ， 让 机 器 人 完成 预 设 工作 的 目的 
是 期 望 其 行为 可 重复 ， 因 而 可 预测 . 

(a) 使 用 IMA(1，1) 模型 预测 下 面 的 5 个 值 ， 并 得 出 95% 预 测 极限 . 

(O 绘图 显示 预测 值 、 预 测 极限 和 真实 值 ， 并 解释 结果 . 

(c) 再 用 ARMA(1，1) 模型 来 预测 下 面 的 5 个 值 ， 得 出 95%% 预 测 极限 ， 并 与 (a) 中 
的 结果 相 比 较 . 

9.24 图 表 9-4 是 对 加 拿 大 野兔 丰 度 序列 值 取 平 方 根 后 ， 关 于 修正 序列 的 预测 和 95% 预 测 极 
限 ， 数 据 在 名 为 hare 的 文档 中 ， 画 出 基于 原 序 列 数据 的 图 ， 即 画 出 原 丰 度 序列 、 上 述 
预测 值 平方 和 预测 极限 平方 的 图 . 

9.25 ”对 习题 9.8 中 月 度 发 电量 时 间 序 列 的 对 数 序列 ， 应 用 季节 均值 加 线性 时 间 趋 势 的 模型 ， 
(数据 在 名 为 electricity 的 文档 里 . ) 

(a) 求 原 序列 的 2 年 预测 和 预测 极限 ， 即 对 习题 9. 8 的 结果 取 指 数 寡 〈 取 对 数 的 逆 运 
算 )， 
(b) 画 出 原 时 间 序 列 最 后 5 年 及 未 来 2 年 的 预测 和 95% 预 测 极限 的 图 ， 并 予以 解释 ， 


附录 E 条 件 期 望 
如 果 X 和 立 有 联合 概率 密度 函数 f(z，?y)， 记 X 的 边际 概率 密度 函数 为 f(x)， 那 么 给 定 X= 
工时 ,的 条 件 概率 密度 函数 可 给 出 如 下 : 


_ f(x,y) 
flylz) f(x) 


对 给 定 的 工 值 ， 条 件 概率 密度 具备 概率 密度 函数 所 有 的 一 般 性 质 ， 特 别 地 ， 给 定 X=, YW 
条 件 期 望 定 义 如 下 : 


E(Y|X = z) = | of Cylz)dy 
作为 期 望 值 或 均值 ， 给 定 X= 二 x ，Y 的 条 件 期 望 具备 所 有 的 一 般 性 质 ， 比 如 ， 


El(aY +6Z +¢|X = 2) =aE(Y|X =2) +6E(2Z|X =z) +e (9. E. 1) 
和 
ELAY) |X = <] = | AD FOlzdy (9. E. 2) 
此 外 ， 还 有 如 下 新 的 性 质 : 
ETACX) |X = 2] = A(z) (9. E. 3) 
也 就 是 说 ， 给 定 Xr, MEERLO 可 以 当做 常数 h) 处 理 ， 更 一 般 地 ， 
ELACX.Y) |X = 2] = E(A(x,Y) |X = z” (9. E. 4) 


#4 EY |X=x)=e(2), WW g(X) 是 一 个 随机 变量 ， 因 此 可 以 考虑 Ele (XJ, EH 
El g(X)] = ECY) 
上 式 也 经 常 写成 


ELECY|X)] = E(Y) (9. E. 5) 
如 果 Y MX 是 独立 的 ， 那 么 
E(Y|X) = E(Y) (9. E. 6) 


附录 F 最 小 均 方 误差 预测 


假设 Y 是 均值 为 yy、 方 差 为 of 的 随机 变量 .如果 目标 是 仅 用 常数 < 来 预测 Y， 那 么 最 住 
的 c 是 多 少 呢 ? 很 清楚 ， 这 里 必须 首先 定义 何 为 最 佳 . 一般 (而 且 方 便 ) 的 标准 是 选择 使 预测 
HRE EDH co ERE, REFA: 
g(c) = EL(Y — c)? ] 
展开 g), # 
g(c) = E(Y*) —2cE (Y) + c 
因为 g(c) 是 < 的 二 次 函数 ， 且 开口 向 上 ， 所 以 解 & Co =0 可 得 最 小 值 ， 有 
g (c) =— 2E(Y) 十 2c 
所 以 最 优 的 ec 是 
c= E(Y) =p (9. F. 1) 


还 要 注意 
min gc) = EY — p> = oF. (9. F. 2) 
现在 假设 第 二 个 随机 变量 X 的 值 能 得 到 ， 希望 借助 X 的 观测 值 来 预测 Y. 4 p=Corr(X, 
Y)， 为 简便 起 见 ， 先 假设 只 有 线性 函数 a 十 bX 可 用 于 预测 ， 则 均 方 误差 给 出 如 下 : 
g(a,b) = E(Y —a — bx)’ 
展开 后 有 
g(ayb) = E(Y*) +a’ +B E(X?) — 2aE (Y) + 2abE(X) — 26E (XY) 
这 也 是 a 和 4 的 二 次 函数 ， 且 开口 向 上 . 因此， 可 以 通过 解 联 立 方程 组 Og (a, b)/da=0 和 Og 
Ca, b)/3b=0 得 到 最 小 值 . 有 
Og(a,b)/da = 2a — 2EC(Y) + 2bECX) = 0 
Og(a,b)/0b = 2bE(X’) + 2aE(X) — 2E( XY) = 0 
重新 写成 
a+ E(X)b = ECY) 
E(X)a+ E(X’)b = E( XY) 
HEX) 乘 以 第 一 个 方程 ， 再 减 去 第 二 个 方程 得 


_ EC(XY) — ECX)E(Y) _ Cov(X,Y) _ or bs Pg) 
E(X?) — LECX) } Var(X) fax (K 
则 ' 
a = E(Y) — bE(X) = py — p tux (9. F. 4) 
X 


如 果 令 了 为 基于 X 的 线性 函数 所 得 Y 的 最 小 均 方 误差 预测 ， 那 么 有 
Y= [e — 0px |t [esse |X (9. F. 5) 
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或 者 
[人 (9. F. 6) 
对 于 标准 化 的 变量 了 " 和 XX" ， 可 简化 为 Y" =X". 
并 且 ， 使 用 公式 (9. F. 3) 和 公式 (9. F. 4)， 可 得 
min g(a,b) = o (1— p) (9.F. 7) 
既然 g(a, b)>0, MAKES T —1<p<tl] 的 一 个 证 明 . 
如 果 将 公式 〈9.F.7) 和 公式 〈9.F. 2) 比较 ， 则 可 看 出 用 X 的 线性 函数 来 预测 Y， 比 不 考虑 X 
而 简单 地 用 常数 项 py 进行 预测 ， 所 得 到 的 最 小 均 方 误 差 要 小 ， 二 者 相差 一 个 乘 子 1 一 A/. 
现在 考虑 更 一 般 的 情况 ， 即 用 X 的 任意 函数 来 预测 Y， 标 准 仍 是 最 小 化 均 方 误差 预测 .这 
里 需要 选择 函数 A(X)， 使 下 式 达 到 最 小 : 


ELY — A(X) 了 (9. F. 8) 
使 用 公式 (9. E. 5) ， 上 式 可 写成 
ELY — h(X)} = E(E{[Y — h(X)J |X} (9. F. 9) 
使 用 公式 (9. E. 4)， 里 层 的 期 望 可 写成 
E({(Y —ACX)]}? |X = x) = E({(Y—A(z)]}? |X = z} (9. F. 10) 


对 每 一 个 值 ，A(z) 都 是 一 个 常数 ， 而 且 可 应 用 公式 (O.F. 1) 的 结果 于 给 定 XS 的 Y 的 条 
件 分 布 ， 因 此 ， 对 每 一 个 z，A(z) 的 最 优选 择 都 是 
h(x) = E(Y|X = zx) (9. F. 11) 
既然 h(x) 的 这 一 选择 可 令 公 式 (9.F.9) 的 里 层 期 望 达到 最 小 ， 则 其 必然 会 使 公式 
(9. F. 8) 整体 达到 最 小 .因此 
h(X) = E(Y|X) (9. F. 12) 
是 基于 所 有 关于 X 的 函数 所 得 的 Y 的 最 优 预测 . 
如 果 X MY 有 二 元 正 态 分 布 ， 众 所 周知 有 
E(Y|X) = py + p(X — px) 


从 而 公式 〈9.F. 12) 和 公式 〈9.F.5) 的 解 是 一 致 的 ， 此 时 线性 预测 是 所 有 函数 中 最 好 的 . 
更 一 般 地 ， 如 果 用 一 个 X ，X: ，…，X, 的 聘 数 来 预测 Y， 则 易 证 最 小 均 方 误差 预测 为 
ECY A (9. F. 13) 


附录 G 截断 线性 过 程 


假设 (Y,) 满足 一 般 的 ARIMACp, d, qa) 模型 ， 其 中 AR 的 特征 多 项 式 是 xz)，MA 的 
特征 多 项 式 是 0(x)， 常 数 项 是 O. WA CY.) 的 截断 线性 过 程 表达 式 为 
Ya =CO+L®, £>1 CO 


其 中 
t 一 ] 
L= $i penis LÈ (9. G. 2) 
7=0 


r #71 


C2) = wae +D Y Biti (Gy (9. G. 3) 


i=] j=0 


MAA; B;G=1, 2, , r, j=l, 2, -o A) SECM RRM, AMRF Y., Yi oe? 
通常 ， 几 权重 由 下 述 等 式 定 义 ， | 
PCr) 一 Ti + par tpr 十) = Ox) (9. G. 4) 
或 者 
PEDD + par + gpr? +e) = Or) (9. G. 5) 
可 证 公式 (9. G. D 中 的 表达 式 成 立 ， 证 明 如 下 : 固定 MGO BEPA EW 
RAM. BP 
CUA — aC, (4-1) — pC U — 2) pC p—d) =a, te (9.G,6) 
MA LO 是 一 个 特 解 CONG 0): 
LD — gL. — 1) — gel C6 — 2) oe s ppal — pd) 
= ne ~ Oie- — Pene 一 人 一 QE tty sg (9. G. 7) 
HACH 包含 ptd AERA APR A, B HCHO ALC 相 加 ， 得 到 ARIMA 方 
程 的 通 解 ，{Y,) 过 程 所 满足 的 初始 条 件 决 定 了 A AB 的 取 值 . 
注意 A, 并 非 任 意 取 值 ， 有 


Ay 7 
—————S (9. G. 8) 
A (1 一 由 一 由 一 = pe 


公式 (9. G. 2) 所 给 CW 是 余 函 数 ， 且 满足 公式 (9.G. 6) 的 证 明 ， 是 一 个 得 自 差 分 方程 理 

论 的 标准 结论 (例如 ， 见 Goldberg, 1958). 下 面 证 明 公 式 (9. G. 2) WR TO 的 确 满 足 
公式 (9.G.7). 

KESHE, 4 j>ptd 时 , $ gj 一 0，。 公式 (9.G.7) 的 左边 可 写成 ; 

(fh Eny T pi Er E ia n (he 1E) 一 ay (fo Cres "F pi Erte-2 ae 


| (9. G. 9) 
十 Qy-2er41) =< Poa (qo Crte-p-d oT fh Ert- pd—l q ke Pi- pd- Erh ) | 
现在 合并 相同 的 e 项 ， 并 列 出 其 系数 ， 有 
emei 的 系数 :yh 
Cree? 的 系数 :内 一 gio 
Cura 的 系数 sp — Dit — Pz Yo 
eni BY RRM ser — oe — Grea — 8 — Cpa hepa 
如 果 eq. WAHAB SAN (9. G. 7) 右边 相对 应 的 系数 相 匹 本 | 得 出 如 下 关系 : 
gh = 1 
dy — gigs =— 0 
a ee i ak (9. G. 10) 


Pa — pipri — pefr — M Papo 一 一 a, 
de-i — Pi per — Pepea — °° — Pra pr-p-a = 0 2 > |G 


Ə 仅 依赖 于 Yrs Yy--15 mh 是 这 里 唯一 用 到 的 C, (r) 的 性 质 . 
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但 是 ， 通 过 比较 上 述 关系 与 公式 (9. G. 5)， 可 看 出 〈9. G. 10) 恰 为 定义 少 权重 的 方程 组 ， 这 
样 就 如 愿 得 出 了 公式 (9. G. 7). 


附录 H 状态 空间 模型 


自从 1960 年 Kalman (EKE) 发 表 了 其 影响 深远 的 杰出 工作 之 后 ， 控 制 论 专家 就 发 展 并 
成 功 应 用 了 所 谓 的 状态 室 间 模型 和 卡尔 曼 滤 波 . 近期 相关 的 著作 有 Durbin 以 及 Koopman 
(2001) 以 及 Harvey 等 (2004). 
< 考虑 一 般 的 平稳 可 道 ARMA(p，g) 过 程 (Z). &m=max(p, g+]), WHELAN 
状态 定义 为 长 度 是 m 的 列 向 量 Z(t)， 其 第 j 个 元 素 是 基于 Z,，2,-1，… 的 预测 值 Z(j)，j 二 0， 
1,2,…,m 一 1 .注意 Z(z) 的 首 元 素 恰 是 2(0) 一 2 

回顾 更 新 公式 (9. 6. 1) ， 其 在 目前 的 情境 下 可 写成 : 

2a) 一 之 (十 1) + bem (9. H. 1) 
对 2 一 0,1,2,…,m 一 2, 可 直接 应 用 上 述 表 达 式 ， 对 {一 m 一 1， 有 
Ža n1) = Z,0m) + pm Em 

| = $ 7(m—D+h Z(m—2)+-++4, 2 (m— P) + gmin (9. H. 2) 
其 中 最 后 的 表达 式 得 目 公式 (9.3.34), p=. 

关于 Z(t 十 1) 5 Z0) 和 ei 关系 的 公式 (9. H.1) 和 (9,. H. 2) 的 矩阵 形式 ， 称 为 状态 
方程 (或 赤 池 马尔 可 夫 表 示 )， 给 出 如 下 : 


Z(t+1) = FZ (t) + Gem (9. H. 3) 
其 中 
0 l 9 0 0 
0 0) 1 0 
0 0 0 1 = 0 
E=, (9. H. 4) 
0 0 0 O s+ 1 
Pn Pmi g " = $i 
各 
l 
gn s 
G = (he (9. H. 5) 
Per 


其 中 ， 当 j>pif, =O. 注意 公式 (9. H. 3) 的 简洁 性 是 以 必须 处 理 向 量 值 过 程 为 代价 的 . 
因为 状态 空间 形式 通常 容许 有 测量 误差 ， 所 以 对 Z, 的 观测 不 采取 直接 的 方式 ， 而 只 是 通过 如 
下 观测 方程 来 观察 Y, : 

Y, = HZ) +e, (9. H. 6) 
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其 中 H=(1, 0, 0, =, 0], MHA {fe} 是 独立 于 (e) 的 另 一 个 零 均 值 白 品 声 . 在 公式 
(9.H.6) 中 令 s= 王 0， 即 可 得 出 无 测量 误差 的 特例 ， 等 价 地 ， 在 后 续 方 程 组 中 令 of =0 也 能 得 
到 这 一 特例 .在 更 一 般 的 状态 空间 模型 中 ，F，G 和 H 的 形式 更 一 般 ， 抑 或 是 时 变 的 . 

似 然 函 数 和 卡尔 曼 滤 波 的 估计 

首先 定义 : nX1 随机 向 量 X 的 协 方差 和 矩阵 是 n Xn HEH, HB ij 个 元 素 是 X 的 第 i 个 与 
第 j 个 分 量 的 协 方差 . 

如 果 Y 二 AX 十 B， 那 么 易 证 Y 的 协 方差 窍 阵 是 4AVA- ， 其 中 Y EX 的 协 方差 矩阵 ， 上 标 T 
{XK te Hi A PE. 

回 到 卡尔 曼 滤波 ， 令 Z(t 十 11t) 代表 mX1 的 向 量 ， 其 第 j 个 分 量 是 ELZ Ol YY. 
Yı], j=O0.1,2,*5m—1. Ssh, $ Zee) 表示 第 j 个 分 量 是 EL G) | YY ,YY ] 的 
m, j= 0,1,2,*…,m 一 1. J 

那么 ， 因 为 e IEF Z Z-s os MDR F Y,, Yio > WAA (9. H. 3) 看 出 

Z(t 二 +1|t) = FZ(t|t) (9. H. 7) 

BS P(t 十 11z) 为 “预测 误差 ”Z(t 十 1) 一 Z(t 十 112) 的 协 方差 矩阵 ，P(z 1t〉 为 “预测 误 

差 ”Z(t) 一 Z(t1t) 的 协 方差 矩阵 ， 由 公式 (9. H. 3) 得 


P(t++1|1) = FU P(t|t) JF’ + GG" (9. H. 8) 
在 观测 方程 (公式 (9. H.6)) pH, Act 1 和 替换 上 得 到 
Y(t++1|t) = AZ(t+1|2) (9. H. 9) 


其 中 Y(t1|2) = ELY,:' IY; Xe jg oig Yih 
这 时 可 证 以 下 关系 成 立 (kán, W Harvey, 1981c): 


Z(t 二 11 十 1) = ZG 十 11 二 KG 十 [Ym 一 Y(t 十 112)] (9. H. 10) 
其 中 
K(t+1) = P@+1|0OM (HP(t+1|0H* +0)" 4: E Pa N D 
和 
PC 十 11( 十 1)) 一 Pt 十 1 一 下 (上 十 1)BP( 十 1 (9. H. 12) 


公式 (9. H. 10)、 公 式 (9. H. 11) 和 公式 (9. H. 12) 总 称 为 卡尔 曼 滤 波 方程 组 ， 公 式 (9. H. 10) 
中 的 量 
erra, = Yo, 一 Y(t 十 1|0) (9. H. 13) 
是 预测 误差 ， 且 与 过 去 的 观察 值 Y,，Y,，,，… 独 立 (或 至 少 不 相 关 ). 因为 允许 有 测量 误差 ， 
所 以 一 般 来 说 误差 err, A F et 二 1。 
由 公式 (9. H. 13) 和 公式 (9. H. 6)， 有 
,一 Var(Cerr ) = HP(t+1\|0)H'+¢ (9. H714) 
现在 考虑 观察 序列 Y，，Y,，…，Y, 的 似 然 函 数 . 由 条 件 概率 密度 函数 的 定义 ， 可 写 出 
FO ya Vn) = Fyn |r ya Yma D LOM 9 2 988 Yaa) 
或 者 ， 取 对 数 得 
log fCyi yy yw) = log f Cy oy2 98% s Yni) + logf Cyn [yi eve o*t ye (9. H. 15) 
现在 假定 对 象 为 正 态 分 布 ， 即 (e) Al {e,} 都 是 正 态 白 噪声 过 程 ， 那 么 已 知 Y, 关于 YY 二 
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yy 二 yn_1 的 条 件 分 布 也 是 正 态 分 布 ， 均 值 是 y(n|n 一 1)， 方 差 是 n. EE 
节余 下 的 部 分 及 下 一 节 中 ， 记 Y(n|n 一 1) 的 观测 值 为 y(n|n 一 1)， 那么 公式 (9. H.15) AW 
第 二 项 可 写 为 ， 


— — 2 
log f Cyn [yi yz s Vea) 一 一 = loge = = logy, 一 + be ti 
Vn 


进一步 ， 公 式 (9. H. 15) 右边 第 一 项 可 以 重复 分 解 直 到 


log fCyi yy Yn) = dj log fC», [yi yee ever) logf Cy) C9. H. 16) 
t= 
AS Ay ALL SR Fa iR EP RE BI 
i ft iT = — 2 
log f(y yzy) =— Žlogar Yu) by = le DT (9. H. 17) 
t=] r=] t 


其 中 y(1/0)=0, v= Var(Y)). 

对 于 给 定 的 参数 取 值 集合 ,计算 其 似 然 值 的 整体 策略 是 ， 使 用 卡尔 曼 滤 波 方程 组 递归 生成 
预测 误差 及 其 方差 ， 再 使 用 似 然 函 数 的 预测 误差 分 解 ， 这 里 仅 有 一 点 有 待 解 决 : 需要 初始 值 
Z(0|10) 和 PC(0|10) 启动 递归 过 程 . 

初始 状态 协 方差 矩阵 

对 零 均 值 过 程 ， 初 始 状态 向 量 Z(010) 是 截 向 量 ， 且 Pt010) 是 200) 一 2Z0010)= 二 2Z(0) 的 
协 方差 矩阵 ， 现 在， 因为 Z(0) 是 各 元 素 为 (ZA, 2C), +> Z(m—1)] 的 列 向 量 ， 故 有 必 
要 计算 

CovLZ,€):2,G)], icf =0,1*+,m—1 
由 截断 线性 过 程 的 形式 ， 公 式 (9.3.35) HCO(O=Z2,0, MF OO TAA 


l 
Zi = ZA) + D> pea (9. H. 18) 
i=—j 
用 Z, FEW Ast (9. H. 18) ， 然 后 取 期 望 值得 到 
yi = E(QZ;) = ELZ,00(2,G))], 720 (9. H. 19) 


现在 ， 在 公式 (9. H. 18) 中 用 i 代替 i 再 乘 以 自身 ， 然 后 取 期 望 值 . 忆 及 诸 e 均 独立 于 过 去 的 
Z， 并 假定 O<I<j, 48 
Yi = Cov[LZ, (i) +Z, (7) J + a yy (9. H. 20) 
结合 公式 (9. H. 19) 和 公式 (9. H. 20) ， 作 为 所 需 P(0j0) 的 元 素 有 
7: 0=-isjsam—lil 
Cov[Z, (2) 5Z, (7) ] -| i=l (9. H. 21) 
Vii 一 下 >》 办 Wi l= i = 全 
其 中 山 权重 得 自 公 式 (4.4.7) 的 递归 ， 而 (2) 过 程 的 自 协 方差 函数 y 则 是 如 附录 C 中 那样 
得 到 . 
通过 a 除 以 oa: ， 即 可 从 问题 中 将 去 掉 . 对 数 似 然 公式 (9. H. 17) 中 的 预测 误差 方差 v 
替换 为 zy,， 并 在 公式 (9. H. 8) PRHE =l 去掉 不 必要 的 常数 ， 得 到 新 的 对 数 似 然 函数 
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t=») (log Cory.) | (9. H. 22) 
t=] t 
关于 ce ， 上 式 可 以 解析 地 最 小 化 ， 得 到 
J 到 > [| (9. H. 23) 
将 上 式 代 入 公式 (9. H. 22), RB 
= Slog, + nlog 3) [= 2CU— DT | (9. H. 24) 
t=1 tm] t 


上 式 关 于 $i» $z» tta $p» his Ory "s 0; 和 和 ot， 必须 用 数值 方法 才能 最 小 化 . 完成 这 些 工作 
后 ， 回 到 公式 (9. H. 23) 来 估计 ot. 公式 (9. H. 24) 定义 的 葡 数 有 时 也 称 为 集中 化 对 数 似 然 
函数 . 


第 10 章 季节 模型 


第 3 章 介 绍 了 如 何 建立 季节 性 确定 趋势 模型 。 然 而， 在 应 用 时 间 序 列 的 很 多 领域 中 ， 尤 
其 是 在 商业 及 经 济 领域 中 ， 任 何 确定 趋势 的 假设 都 相当 可 疑 ， 即 便 序 列 中 普遍 存在 着 循环 
趋势. 

举 个 例子 : 在 世界 多 个 地 区 进行 着 大 气 中 所 含 二 氧化 碳 (CO) 水 平 的 监测 ， 用 以 研究 大 
气 变 化 情况 ， 其 中 之 一 是 靠近 北极 圈 地 处 加 拿 大 西北 部 边境 的 阿 勒 特 . 


Alert 


< qq aren ae K : } ey ot y 
E | $ i a < STAT SER E rs 


图 表 10-1 中 显示 的 是 自 1994 年 1 H Æ 2004 年 12 月 间 阿 勒 特地 区 的 月 度 CO, 水 平 ， 该 图 
有 强势 上 升 趋势 ， 同 时 也 具有 季节 性 特征 ， 后 者 可 在 更 为 详尽 的 图 表 10-2 中 看 到 ， 图 表 10-2 
仅 用 月 度 符号 绘 出 了 最 后 几 年 的 情况 . 


图 表 10-1 加 拿 大 西北 部 阿 勒 特地 区 的 月 CO, 水 平 


CO 
350 365 380 


1994 1996 1998 2000 2002 2004 
年 份 


> data(co2) 
> win.graph(width=4.875,height=3,pointsize=8) 
> plot (co2,ylab='C02') 


正如 两 图 所 示 ， 冬 季 月 份 CO, 含量 偏 高 ， 而 夏季 月 份 低 得 多 . 这 里 当然 可 以 考虑 应 用 确 
定性 季节 模型 ， 如 已 在 第 3 章 中 研究 过 的 带 有 线性 时 间 趋 势 的 季节 均值 模型 ， 或 是 带 有 线性 时 
间 趋 势 的 不 同 频率 上 余弦 曲线 的 加 总 模型 ， 但 是 我 们 发 现 ， 这 些 模 型 无 法 解释 该 时 间 序 列 的 行 
为 ， 可 以 证 明 对 此 序列 以 及 许多 其 他 的 序列 而 言 ， 从 带 有 线性 时 间 趋 势 的 季节 均值 模型 得 到 的 
残 差 在 许多 滞后 点 都 高 度 自 相 关 ? .相反 地 ， 下 面 我 们 将 看 到 本 章 所 要 研究 的 随机 季节 模型 却 
能 够 很 好 地 拟 合 这 一 序列 . 


O 习题 10. 8 中， 要求 该 者 给 出 这 个 证 明 . 
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年 份 
> plot (window (co2, start=c (2000, 1} ) ,ylab='CO2') 
> Month]=c('J','F','M','A', MT ,JA 'S','O', 'N', 'D') 
> points (window (co2,start=c(2000,1)),pch=Month) 


10.1 季节 ARIMA 模型 


我 们 先 来 研究 平稳 模型 ， 在 10. 3 节 中 ， 再 进一步 考虑 非 平 稳 的 推广 情况 ， 令 s RRE A 
的 季节 周期 ;月度 序 列 情形 s=—12, BEER STAI s=4. 
考虑 根据 下 式 所 生成 的 时 间 序 列 : 
Y, = e, — @e mız 
注意 到 
Cov (Y,,.¥_)) = Cove, — Oei s161 — Oe) = 0 
但 是 
Cov(Y Y u) = Cov(e — Oeir s€m: — Oera) =— Oo: 
很 容易 看 出 ， 该 序列 是 平稳 的 ， 而 且 仅 在 滞后 12 处 才 有 非 零 的 自 相 关 性 . 
概括 上 述 想 法 ， 定 义 季节 周期 为 s 的 0 阶 季节 MA({Q) 模型 如 下 : 
Y, = e, — Be, — @rer2, — "| — OE ig (10. 1.1) 
其 季节 MA 特征 多 项 式 为 
Alr) = 1—0 r — Gr — + — Gor™ (10. 1. 2) 
显然 ， 该 序列 总 是 平稳 的 ， HEA 相关 函数 只 在 Sy 25, 35, "s, Qs & 2545 Hea Ede. 特 
别 地 ， 


— TAF AG toi + O00 k = 1525" Q (10. 1. 3) 


ical 1+ 6} +6; +++ + 8% 
(比较 此 式 与 关于 非 季节 性 MA 过 程 的 方程 (4. 2. 5). ) RRA RR, PLATE Ox) =0 
的 所 有 根 的 绝对 值 都 必须 大 于 1. 
值得 注意 的 是 ， 季 节 MA(Q) 模型 也 可 以 看 做 是 阶 数 gq 二 Qs 的 非 季节 性 MA 模型 的 特例 ， 
但 后 者 除了 在 季节 滞后 s，25，3s，…，Qs 处 ， 所 有 的 8 值 都 取 零 . 
同样 可 以 定义 季节 自 回 归 模 型 ， 考 虚 
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Y, = BY, +e (10. 1. 4) 
Hp | S/<1, e MUWF Yis Yos +. AAWE, O<. 能 够 确保 序列 是 平稳 的 ， 故 易 证 
E(Y,.)=0; 在 方程 (10. 1.4) WAAR Y,;， 取 期 望 值 ， 并 除 以 yv, R 
p = Bor, kl CLG. 1.5) 
显然 
pz = Pp, =. pu = pu = P 
更 一 般 地 ， 


pi = BD, k=1,2,. (10. 1. 6) 
进一步 地 ， 先 后 取 定 方程 (10.1.5) 中 的 分 别 为 1 和 11， 并 利用 pi 二 p-:， 得 到 
p = pn» pn = Pp. 
这 意味 着 pi =o. =0. 类似 可 证 ， 除 了 在 季节 滞后 12，24，36，… 处 以 外 ，m=0 总 成 立 ， 在 
滞后 处 取 以 上 值 时 ， 自 相关 函数 如 同 ARC) 模型 一 样 以 指数 方式 衰减 . 
记 住 这 个 例子 ， 定 义 一 个 季节 周期 为 s 的 P 阶 季节 AR(P) 模型 如 下 : 


Y, = OY. + ®:Y--2, + °° + BpY, te, (10. 1. 7) 

其 季节 特征 多 项 式 为 
lr) = 1 — B r — r” — — Dpr™ (10. 1. 8) 
通常 要 求 e, 独立 于 YY _ ,，Y_:，，…， 而 且 为 了 确保 平稳 性 ， 要 求 特征 方程 O(c) =-0 的 所 有 根 


的 绝对 值 都 大 于 1， 再 次 地 ， 方 程 (10. 1.7) 可 以 看 做 是 一 个 阶 数 p= Ps 的 特定 AR(p) 模 
型 ， WEF HA sr 28, 355 s Ps 处 才 有 非 零 的 $ 系数 . 

可 以 证 明 ， 自 相关 函数 仅 在 滞后 为 *，2s*，3s*，… 处 非 零 ， 其 行为 很 像 是 指数 衰减 函数 和 
阻尼 正弦 函数 的 组 合 ， 特 别 地 ， 方 程 (10.1.4). WH (10.1.5) 和 方程 (10.1.6) 易 推广 到 
广义 季节 ARO) 模型 ， 此 时 

m=, k= 125 (10. 1. 9) 


TE iit Jen A At A AY Se: A 


10.2 乘法 季节 ARMA 模型 


我 们 几乎 不 需要 那些 仅 在 季节 性 滞后 上 包含 自 相关 性 的 模型 结合 在 季节 与 非 季节 AR- 
MA 模型 上 的 思考 ， 可 以 构造 出 一 类 简洁 的 模型 ， 它 们 不 仅 在 季节 滞后 上 包含 相关 性 ， 而 且 在 
邻近 序列 值 的 更 小 滞后 上 亦 然 . 

考虑 一 个 MA 模型 ， 其 特征 多 项 式 如 下 : 

(1— @r) (C1 — @r”) 
将 上 式 乘 开 后 ， 得 到 1 一 bz 一 89z2 十 g8z23s.， 因 此， 相应 的 时 间 序 列 满足 下 式 : 


= é, — Ge, — Oen 十 09e 13 Ci. "A 

可 验证 此 模型 的 自 相 关 函 数 只 在 滞后 1，11，12 和 13 上 非 零 ， 可 以 求 出 
yo 一 (1 十 天 )(1 十 @)or (10. 2. 2) 
i (10. 2. 3) 


“The 
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pn = pu = CHIT (10. 2. 4) 


并 且 

pe =e (10. 2.5) 
图 表 10-3 显示 的 是 方程 (10. 2. 1) 所 定义 模型 的 自 相 关 函 数 ， 其 中 8 二 土 0. 5， 昌 二 一 0.8， 如 
方程 组 (10.2.2) ~ (10.2.5) 所 给 出 的 那样 . 


图 表 10-3 由 方程 组 (10.2.2) ~ (10.2.5) 得 到 的 自 相 关 图 


@=-0).5, 二 -0 .8 8=+0.5, =-0.8 


0.4 
0 


Pi: 
0.0 


0 
-0.4 


oR, + A Le M— ThA 12. 1 A EFR MA 模型 来 同时 引入 短期 和 季节 
自 相 关 . 下 节 将 会 看 到 ， 差 分 后 的 非 平稳 模型 将 很 自然 地 引出 “乘法 ”模型 . 

那么 ， 一 般 定义 季节 周期 为 s HREBZPARMA(p, g)X(P, QO), 模型 是 AR 特征 多 项 式 
H PDP), MA 特征 多 项 式 为 DOr) 的 模型 ， 其 中 


Ha) 一 1> fir $a? — + ppr’ (10. 2. 6) 
plr) = l-r’ 一 p, r” <r — Pox” 

与 
Ax) = 1— Ox ha 一 人 Or (10.2.7) 
Olr) = 1— Ox" — Or — + Oor ™ 


模型 中 也 可 能 包含 一 个 常数 项 山 ， 再 次 注意 ， 这 只 是 一 个 特殊 的 ARMA 模型 ， 它 的 AR 项 阶 
数 为 p+ Ps, MA 项 阶 数 为 gq 十 Qs， 但 其 系数 不 具有 完全 的 一 般 性 ， 而 仅 由 pt+Pteqt+QtH 
数 所 决定 。 车 ;二 12， 则 由 于 p 十 P 十 g 十 Q 会 远 小 于 pp 十 Ps 十 g 十 Qs， 因 此 将 得 到 一 个 更 为 简洁 
的 模型， 

再 举 一 个 例子 ,假设 P=q=1, p=Q=0H ;二 12， 则 模型 为 


Y; -3 PY -12 + e, — Ger; (10. 2. 8) 
使 用 标准 技巧 可 得 
yı = yu — s; (10. 2. 9) 
H. 
Ye = PY eino’ R 之 2 (10. 2. 10) 


考虑 以 上 公式 中 的 & 取 不 同 的 值 以 后 ， 可 以 得 到 


168 # 10% 


rrl 十 中 
% = E; o; | 
Pr» =P, kI (10. 2.11) 
g l 
Pin- ~~ Pin 一 tee | k = PN, 


“Sra AA RAE. BAAS. 
图 表 10-4 显示 的 是 两 个 周期 都 为 12 的 此 类 季节 ARIMA 过 程 的 自 相 关上 图 数 ， 一 个 过 程 的 
瑟 一 0. 75，0 一 0.4， 另 一 个 过 程 的 更 =0.75，0 一 一 0.4， 在 众多 季节 时 间 序 列 的 样本 目 相 关 函 
数 中 ， 这 两 个 自 相关 函数 的 形状 堪 称 典型 ， 而 在 图 表 10-3 中 显示 的 由 方程 (10. 2. 3) ， 方 程 
(10. 2. 4) 和 方程 (10. 2. 5) 所 给 出 的 更 为 简单 的 自 相 关 函 数 ， 在 实际 中 似 亦 多 见 也许 是 经 
差分 处 理 的 ). 
图 表 10-4 由 方程 (10.2.11) 得 到 的 自 相 关 函 数 


ai B=0.75, 0=-0.4 = p=0.75, 0=0.4 
= = 
T + ] 
= E | 
ae, ] 
之 | < 
= |! = 
= = 
+ 
S- morr $ mrm 
| 12 24 36 48 60 1 12 24 36 48 60 
H lak Ht ak 


10.3 4E- #75 ARIMA 模型 


季节 差分 是 非 平稳 季节 过 程 建 模 的 一 个 重要 工具 .时间 序 列 {Y,} 的 周期 为 s 的 季节 差分 
HĦV-Y, 表示 ， EMi P: 
VY, = Y, — Y.. (10. 3. 1) 
Hu. SRBAMRAW LABIA, 2AR!2 As eee 相继 年 份 中 的 数据 变化 情况 注意， 长 度 
为 n 的 序列 其 季节 差分 序列 的 长 度 为 n 一 :， 也 就 是 说 ， 季 节 差 分 后 丢失 了 s 个 数据 值 . 
作为 适用 季节 差分 的 一 个 例子 ， 考 虚 由 下 式 所 生成 的 一 个 过 程 ; 
Y= 5 teë, (10. 3. 2) 
其 中 
S, = $em, +E (10.3. 3) 
其 中 (e) Al {e,) 是 独立 的 白 噪 声 序列 . 这 里 的 {S,} “BML”, HE ce< 冬 ce， 
则 So 将 为 慢 变 季 节 部 分 的 模型 . 
由 于 (S) 是 非 平稳 的 ， 显 然 (Y) 也 是 非 平稳 的 ， 然而 ， 若 按 方程 (10.3.1) 那样 对 
{Y,) 作 季 节 差 分 变换 ， 则 将 得 到 
VY = S, — S, te — €; =e +e — Er (10. 3. 4) 
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经 简单 计算 可 知 VY, 是 平稳 的 ， 且 其 自 相 关 函 数 与 MA(1), 模型 的 相同 . 
也 可 以 推广 方程 组 (10.3.2) 和 (10.3.3) 所 描述 的 模型 ， 以 表征 非 季 节 慢 变 随 机 趋势 . 
考虑 


Y, =M, +S, +e, (10. 3. 5) 
其 中 | 
S, = Sz, te; (10. 3. 6) 
且 
M, = Mma + & (10. 3. 7) 


其 中 {e}, (a) 和 (6) 是 相互 独立 的 白 噪声 序列 ， 这 里 将 同时 应 用 季节 差分 和 普通 的 非 季节 
差分 来 得 到 
VW: Y,= VC(M, — M., + e, F e: — en) 
= (& te, +e) — lemi + eni) — lEn F ers) F ecm (10. 3. 8) 
这 里 所 定义 的 过 程 是 平稳 的 ， 且 只 在 1，s 一 1，s 和 s 十 1 等 滞后 上 有 非 零 自 相关 性 ， 这 同 季 节 
周期 为 的 乘法 季节 模型 ARMA(0，1)X(0，1) 的 自 相 关 结 构 是 一 致 的 . 

以 上 这 些 例 子 引 出 了 非 平稳 季节 模型 的 定义 ， 过程 {Y,}》 称 为 季节 周期 为 *、 非 季 闻 
(规则 的 ) 阶 数 为 p，d 和 gqg， 季 节 阶 数 为 P，D 和 Q 的 乘法 季节 ARMA 模型 ， 前 提 是 差分 
序列 

W, = V’ VPY, (10. 3. 9) 
满足 某 季 节 周 期 为 ;的 ARMAC, 9g) XC(P, Q) RBS. (Y) 称 为 季节 周期 为 :的 ARIMA 
(p，d，9g)X(P，D，Q), 模型 . 

显然 ， 上 述 模型 表示 了 一 族 范围 广大 而 且 灵 活 的 模型 类 ， 从 中 可 为 某 一 特定 时 间 序 列 选择 
一 个 适用 的 模型 ， 经 验证 明 ， 这 些 模型 足以 拟 合 许多 序列 ， 通 常 模型 也 只 要 用 三 四 个 那样 很 少 
的 几 个 参数 . 


10.4 ”模型 识别 、 拟 合 和 检验 


季节 模型 的 识别 、 拟 合 与 检验 的 方法 同 第 6、7、8 章 介 绍 过 的 一 般 方 法 并 无 二 致 ， 这 里 仅 
强调 怎样 将 这 些 一 般 性 的 方法 应 用 于 季节 模型 ， 并 会 对 季节 滞后 予以 特别 关注 ， 

模型 识别 

像 以 往 一 样 ， 第 一 步 就 是 仔细 观察 时 间 序列 图 ,图表 10-1 中 显示 的 是 加 拿 大 北部 地 区 的 
月 CO; 含量 仅 考 虑 图 中 的 上 升 趋势 将 引导 我 们 建立 一 个 非 平稳 模型 ， 图表 10-5 显示 的 是 该 
序列 的 样本 自 相 关 函 数 ， 如 图 所 示 ， 季 节 自 相关 关系 十 分 显著 .注意 在 小 后 12，24，36，… 
上 的 强 相关 性 ， 此 外 ， 还 有 许多 其 他 的 相关 关系 需要 纳入 模型 中 . 


O myth. EVY, 是 平稳 的 ， 且 VV,Y, RTW. 方程 组 (10.3.5), (10.3.6) M (10.3.7) 仅仅 是 用 以 


导出 乘法 季节 ARIMA 模型 . 
全 ”应 用 附录 DD 中 的 延迟 算 子 记号 ， 可 将 一 般 的 ARIMA(p，d，9g) X(P，D，Q)s 模型 写成 $(B)@(B)V。 VPY, = GB) 


AC Bde. 
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图 表 10-5 CO, 含量 的 样本 ACF 


ACF 
02 0.40.6 08 


ee ed ee ee ee e e 


-0.2 
| 


> acf (as.vector (co2) ,1ag.max=36) 


图 表 10-6 ERRARE CO. 会 量 的 时 间 序 列 图 . 
图 表 10-6 CO, 含量 的 一 次 差分 序列 图 


iD 

da = 

E4 

| va z 
| 

| 
o 

a 

1994 1996 1998 2000 2002 2004 
年 份 


> plot (diff (co2) ,ylab='First Difference of CO2' ,xlab='Time') 


正如 图 表 10-7 中 所 印证 的 那样 ， 此 时 序列 中 一 般 性 的 上 升 趋势 已 然 不 在 ， 而 强烈 的 季节 
性 仍然 存在 ， 也 许 应 用 季节 差分 法 所 得 的 序列 能 够 建立 更 为 简约 的 模型 ， 


图 表 10-7 CO, 含量 一 次 差分 序列 的 样本 ACF 


oo 
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> acf (as. vector (diff (co2)) , lag.max=36) 


图 表 10-8 显示 的 是 CO, 含量 数据 经 过 一 次 差分 和 季节 差分 后 的 时 间 序 列 图 此 时 ， 大 部 
分 〈 即 便 不 是 全 部 ) 的 季节 性 已 经 消失 了 ， 


季节 模型 171 


HR 10-8 CO, 含量 经 一 次 和 季节 差分 后 的 时间 序列 图 


+ 

oe N 
> — 
g 

zo 
Ta 
Eq 
o> 
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> plot (diff (diff (co2),1ag=12) ,xlab='Time', 
ylab='First and Seasonal Difference of CO2') 


图 表 10-9 印证 了 经 两 次 差分 后 的 时 间 序 列 已 经 几乎 不 再 具有 自 相关 性 .此 图 也 说 明 也 许 
建立 一 个 只 在 滞后 1 和 12 上 具有 自 相 关 性 的 简单 模型 就 够 了 . 


ER 10-9 CO. 序列 经 一 次 和 季节 差分 后 的 样本 ACF 


0.2 


ACF 
-0.4 -0.2 0.0 


5 10 15 20 25 30 35 
滞后 


> acf (as.vector (diff (diff (co2) ,lag=12)) ,lag.max=36,ci.type='ma') 


考虑 识别 乘法 季节 ARIMACO, 1, 1)X(0, 1, DA% 
Viz VY, = e, — ĝe mı — Qer 1 + Oem (10. 4. 1) 

此 模型 满足 上 述 诸多 要 求 ， 通常， 在 此 阶段 的 所 有 模型 都 是 暂 定 的 ， 需 要 在 模型 构建 的 诊断 阶 
段 予 以 修正 . 

模型 拟 合 

在 为 一 个 特定 的 时 间 序 列 建立 了 试探 性 的 季节 模型 之 后 ， 接 下 来 要 做 的 是 尽 可 能 有 效 地 佑 
计 出 模型 中 的 参数 ， 正 如 前 文中 指出 的 那样 ， 乘 法 季节 ARIMA 模型 只 是 一 般 ARIMA 模型 的 
特例 .就 这 点 而 论 ， 第 ?7 章 所 涉及 的 在 参数 估计 阶段 所 要 进行 的 全 部 工作 都 可 以 直接 应 用 在 季 
节 性 的 讨论 中 . 

对 于 CO, 含量 序列 的 ARIMACO, 1, 1)X(0, 1, 1), AH 10-10 给 出 了 极 大 似 然 
估计 及 其 标准 误差 . 


图 表 10-10 CO; 模型 的 参数 估计 


系 数 a 8 
(eit 0. 5792 0. 8206 
标准 误差 0.0791 0. 1137 


他 二 0. 5446， 对 数 似 然 值 一 一 139.54，AIC 一 283.08 


> ml.co2=arima (co2,order=c(0,1,1),seasonal=list (order=c(0,1,1), 
period=12) ) 
> ml.co2 


所 有 的 系数 估计 值 都 是 高 度 显著 的 ， 进 而 将 对 此 模型 加 以 检验 
诊断 性 检验 
为 了 对 估计 后 的 ARIMA(0，1，1)X (0，1，1)1: 模 型 进行 检验 ， 首 先 需要 观察 残 差 的 时 
BEJE. HÆ 10-11 给 出 了 标准 残 差 图 除了 序列 中 间 存 在 某 些 异 常 行为 外 ， 此 残 差 图 并 没 
有 表明 模型 有 任何 主要 的 不 规则 性 ， 鉴 于 模型 在 1998 年 9 月 时 的 标准 残 差 看 上 去 很 可 疑 ， 可 
能 还 要 进一步 对 模型 做 异常 人 检验 ， 第 11 章 将 会 进一步 研究 这 个 问题 . 
图 表 10-11 ARIMA (0, 1, 1)X(0, 1, 1), RRS 


标准 残 差 


1996 1998 2000 2002 2004 


> plot (window(rstandard(m1.co2) ,start=c(1995,2)), 

ylab='Standardized Residuals',type='0o') 
> abline (h=0) 
I M 

图 表 10-12 绘 出 了 残 差 的 样本 ACF 以 便 进一步 观察 ， 唯 一 “统计 上 显著 的 ”相关 系数 位 
于 滞后 22， 其 值 仅 为 一 0.17， 相 关 性 非常 小 ， 而 且 滞 后 22 上 的 依赖 关系 难以 给 出 合理 的 解 
释 ， 最 终 ， 在 所 示 出 的 36 个 自 相关 系数 中 只 有 一 个 是 统计 上 显著 的 ， 这 一 点 并 不 奇怪， 这 种 
情况 很 容易 碰巧 发 生 ， 除 了 滞后 22 处 的 边缘 显著 性 以 外 ， 此 模型 看 起 来 已 经 捕 提 到 了 序列 中 
依赖 关系 的 本 质 . 

对 模型 进行 Ljung-Box 检验 ， 给 出 自由 度 为 22 的 卡 方 值 为 25. 59， 得 到 产值 为 0.27 
进一步 表明 此 模型 已 捕获 时 间 序 列 中 的 依赖 关系 . 
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AR 10-12 ARIMA(O, 1, 1)% (0, 1, 1) Ep hi AC 


ee ss Ts es a 


ACF 
-02 -0.1 0.0 0.l 


HS 


> acf (as.vector (window(rstandard (ml .co2) ,start=c{1995,2))), 
lag.max=36) 


下 面 借助 于 残 差 来 研究 误差 项 的 正 态 性 问题 ， 图 表 10-13 显示 的 是 残 差 直方 图 .图 中 的 形 
状 有 点 像 “ 钟 形 ”， 但 肯定 不 是 标准 钟 形 . 或 许 分 位 数 -分 位 数 图 能 够 给 出 更 多 的 信息 . 


图 表 10-13 ARIMA (0，1，1) x {0，1，1)ne 模 型 的 残 姜 


频率 


10 20 30 40 


0 


ro a T 
-3 -2 -] 0 123 4 
标准 残 差 


> win.graph(width=3, height=3,pointsize=8) 
> hist (window (rstandard(ml1.co2),start=c(1995,2)), 
xlab='Standardized Residuals') 
图 表 10-14 显示 的 是 残 差 的 QQ ESA. 
图 表 10-14 FRA: ARIMA(0, 1, 1})x(0, }, 1) 模型 


-2 -] Ü ] 2 
理论 分 位 数 
> win.graph (width=2.5,height=2.5,pointsize=8) 
> qgnorm(window (rstandard(ml.co2),start=c(1995,2))) 


> qgline (window (rstandard(m1.co2) ,start=c(1995,2))}) 
ii ee er es == 
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在 图 的 上 尾部 ， 再 次 看 到 了 一 个 异常 值 ， 但 是 Shapiro-Wilk 正 态 性 检验 法 给 出 的 检验 统计 
E W=0. 982， 进 而 得 到 户 值 为 0.11， 且 在 任何 通常 的 显著 性 水 平 上 正 态 性 都 未 被 拒绝 . 
作为 对 模型 的 进一步 检验 ， 根 据 图 表 10-15 中 所 示 的 结果 ， 考 虑 用 ARIMA(0，1，2) 基 
(0，1，1) 模 型 进行 过 度 拟 合 ， 
图 表 10-15 ARIMA(0，1，2)x (0，1，1)w 过 度 拟 合 模型 


系 数 Ay Oe 从 
ftti 0.5714 0.0165 0. 8274 
标 叭 误差 0. 0897 0. 0948 0. 1224 


部 二 0. 5427; HAWA = 139.52, AIC=285. 05 


> m2.co2=arima(co2,order=c(0,1,2),seasonal=list (order=c(0,1,1), 
period=12) ) 
> m2.coz 


当 以 这 些 结果 与 图 表 10-10 中 所 示 结 果 进 行 比较 时 ， 会 发 现 负 与 8 的 估计 值 都 变化 很 
小 一 一 尤其 在 考虑 到 标准 误差 的 大 小 时 .此 外 ， 新 参数 凡 的 估计 和 值 在 统计 上 与 零 无 异 ， 还 应 
注意 ， 在 AIC 实际 上 已 经 增加 的 情况 下 ， 空 和 对 数 似 然 值 都 没有 多 少 变化 . 

ARIMA(0，1，1) XxX (0，1，1),w; 模 型 成 名 于 Box 和 Jenkins(1976) 这 部 经 典 闭 作 的 第 1 
版 ， 它 在 那里 用 来 刻画 月 度 航空 客运 量 时 间 序 列 取 对 数 后 的 特征 ， 自 那 以 后 该 模型 就 以 航线 模 
型 为 人 所 知 ， 在 本 章 习 题 中 ， 将 要 求 读者 分 析 原 始 的 航线 数据 . 


10.5 季节 模型 预测 


同 预期 的 一 样 ， 计 算 季 节 ARIMA 模型 预测 最 简单 的 方法 是 对 模型 递归 地 应 用 差分 方程 形 
式 ,正如 方程 (9.3.28), FÆ (9.3.29) 以 及 方程 (9.3.40) 所 表示 的 那样 ， 例如， 考虑 
ARIMA(O, 1, 1X1, 0, D: EM. 


YY 一 YY = OY 2 — Yes) te — Gee — Beenie 00er (10. 5. 1) 
将 上 式 改 写 为 
Y, = Y, HØY — OY p43 te, — Pen — Oem he, (10. 5. 2) 
那么 从 起 点 上 出 发 的 一 步 癌 前 预测 为 
ÑD = Y, + Yn 一 Ga 一 be 一 Be 十 be (10. 5. 3) 
下 一 个 是 
立 (2) = A) + PY mi — PY u — Oeu + O00en (10. 5. 4) 


并 以 此 类 推 ， 在 前 置 时 刻 t=1], 2, +, 13 E. REM Erias Cigs Creis "e e,( 作 为 残 差 ) 
将 进 人 预测 表达 式 ， 但 是 对 于 {二 13， 将 代 之 以 模型 的 自 回归 部 分 ， 有 
Y( =f, 2—1) +0, —12)— pf, 4—13), £>13 (10. 5. 5) 
为 了 了 解 模 型 预测 的 一 般 性 质 ， 考 虑 以 下 几 种 特殊 情况 . 
季节 AR(1) 2. 


季节 AR(1)1: 模 型 为 
Y, -= PY i: + Er (10. 5. 6) 
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很 明显 地 ， 有 
Y,(4) = P, (4 — 12) (10. 5.7) 
Ril, XL 向 后 迭代 ， 也 可 以 写 出 

Ñ (O = oy, (10. 5. 8) 
这 里 的 和 r 是 由 式 子 4 三 12k 十 r 十 1 所 定义 的 ， 其 中 OSr<12 H k= 0,1,2,…. MAB, k 
是 (一 1) /12 的 整数 部 分 ， 而 r/12 是 (4 一 1)/12 的 小 数 部 分 ， 如 果 最 后 的 观测 点 是 12 月 份 ， 
那么 下 一 期 1 月 份 的 预测 值 为 @ 乘 以 1 月份 的 最 后 观测 值 ，2 月 份 的 预测 值 为 @ 乘 以 2 月份 的 
最 后 观测 值 ， 以 此 类 推 . 后 推 两 期 的 1 月份 预测 值 为 eS 乘 以 1 月 份 的 最 后 观测 值 ， 当 只 关注 1 
月 份 的 数据 时 可 以 发 现 ， 其 未 来 预测 值 将 以 指数 方式 衰减 ， 误 减速 度 取决 于 更 的 大 小 .所 有 各 

月 份 预测 值 的 变化 规律 类 同 ， 区 别 只 是 各 具体 月 份 的 初始 预测 值 不 同 而 已 . 
应 用 公式 (9.3.38) ARIA j 为 12 RA y LES MHS, tH 

p? j=0,12,24,. 


= (10. 5. 9) 
i fo 其 他 
则 预测 误差 方差 可 以 写 为 
Var(e'(b)) = tak (10. 5. 10) 
其 中 同 前 面 一 样 , k Æ 〈& 一 1)712 的 整数 部 分 . 
季节 MA(1),: 模 型 
对 于 季节 MA(1),; 模 型 ， 有 
Y, = e, — Oen + bo (10. 5.11) 
在 这 里 ， 可 以 看 到 
Y,(1) =— Ae,- + b 
Y, (2) noe + A (10. 5. 12) 
Y,(12)=— @e, +b 
且 
Y=, ¢>12 (10. 5. 13) 


这 里 得 出 第 一 年 中 各 月 份 的 不 同 预 测 值 ， 但 是 从 这 以 后 的 所 有 预测 都 将 由 过 程 均 值 给 出 . 
对 该 模型 而 言 ，%% = 二 1]，ys = 二 一， 其 余 情 况 下 4 =0. 因而 根据 公式 (9.3.38) 可 以 


得 到 


o 1<¢<l2 
Var(e,(4)) = = 


(10. 5. 14) 
(1+ @)o 12 < Z 
ARIMA({0, 0, 0) (0, 1, 1). 
ARIMA(K0，0，0)X(0，1，1),， 模 型 为 


Y, _ HET 一 6 一 Oe 12 (10. ari») 
或 者 是 


Y p+ Y e12 + Cre 一 四 ee 1z 
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因此 ， 
Y,(1) = Yi — Oe 
y 2) = Fe 站 i 
YA oer ore (10. 5. 16) 
Y,(12) = Y, — Be, 
继而 
YD) 一 人 (一 12)， ¢>12 (10. 5. 17) 
从 而 可 同样 得 到 所 有 1 月 份 的 预测 ， 同 样 得 到 所 有 2 月 份 的 预测 ， 等 等 . 
如 果 反 转 此 模型 ， 得 到 
Y, = 11 — ®) CY m: + OY a + O'Y 3 Ferre 
结果 可 以 写 出 
Y.<1) = (1 —@) >》 OY 12; 
j=0 
¥,(2) = (1—@) >) OY o-i (10. 5. 18) 


j=0 


Y,(12) = (1—@) > OiY, 1 


从 这 种 表示 中 可 以 发 现 ， 每 年 1 月 份 的 预测 都 是 所 有 1 月 份 观测 值 的 某 个 指数 加 权 滑 动 平均 ， 
每 年 其 他 月 份 类 同 . 
本 例 中 ， 当 j=12，24， if, g=—1—-0, 在 其 他 情况 下 y= 二 0， 则 预测 误差 方差 为 
Varlet) = [1 +40 —@)? Jo? (10. 5.19) 
其 中 , kw (—1)/12 的 整数 部 分 . 
ARIMA(O, 1, 1)X(0, 1, 1). 


对 ARIMA(0，1，1)X(0，1，1)1 模 型 而 言 ， 


= Ya +Y — Yeas + — He, 1 Ge ız + 80 e, i (10. 5. 20) 
预测 值 满足 
将 (1) = Y, +Y- =r — fe, — He -i + @@e 1 
Y, (2) z= YD + Y ex ey — He, + 0A e 
: (10. 5.21) 
Y,(12) = (119 a et a — del 一 @e, 十 的 e， i 
¥,(13) = ¥,(12) + ¥,() —Y, + 00e, 
A 
YY, =¥,4—-1)+¥,¢—-12)-Y¥,4¢—-13),  €>13 (10. 5. 22) 


下 面 的 表达 式 有 助 于 理解 预测 的 一 般 模 式 : 
Y,(4) 一 4 十 AZ 十 pS [Bucos (“75") + Busin( 3 )] (10. 5. 23) 
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其 中 的 A 项 和 B 项 都 依赖 于 Y,，Y,-.;，…， 或 者 换 一 种 说 法 ，A 项 和 B 项 都 是 由 初始 预测 值 ?(1) ， 
Y,(2),…,Y,(13) 所 决定 的 ， 该 结论 得 自 一 般 差 分 方程 理论 ， 涉 及 方程 (一 zx) (1 一 x*) 二 0 的 根 . 

注意 ,方程 (0.5.23) 揭示 了 预 调 值 是 由 前 置 时间 中 的 线性 趋势 和 周期 性 部 分 的 总 和 这 两 个 部 
分 加 总 而 得 然而， 系数 4 AB, 更 依赖 于 近期 而 非 过 去 的 数据 ， 而 且 随 者 预测 起 点 的 亚 化 和 预 负 
值 的 更 新 ， 它 们 也 将 随 过 程 的 改变 而 变化 . 这 明显 不 同 于 带 有 季节 性 因素 加 上 确定 时 间 趋 势 的 情况 
之 预测 ， 那 种 情况 下 系数 同等 程度 地 依赖 于 近期 及 以 往 的 数据 ， 且 在 未 来 的 所 有 预测 里 丝 然 . 

预测 极限 

和 非 季 节 性 的 情况 一 样 ， 预 测 极限 可 以 准确 求 得 ， 这 里 用 CO: 时 间 序 列 的 例子 来 说 明 . 
图 表 10-16 给 出 了 预测 值 以 及 所 拟 合 的 前 置 时 间 为 两 年 的 ARIMAC(0，1，1)X(0，1，1)1: 模 
型 的 95% 预 测 极限 ， 图 中 也 显示 出 了 观测 数据 最 后 两 年 的 值 ， 预 测 值 很 好 地 模仿 出 了 序列 的 
随机 周期 性 ， 而 且 预 测 极限 也 显示 出 预测 之 精度 令 人 满意 . 

图 表 10-16 CO, 模型 的 预测 值 与 预测 极限 


385 390 


CO; 水 平 


370 375 380 


2003 2004 2005 2006 2007 
年 份 


> win.graph (width=4.875,height=3,pointsize=8) 
> plot (m1.co2,nl=c(2003,1),n.ahead=24,xlab='Year',type='o', 
ylab='CO2 Levels') 


图 表 10-17 显示 了 最 后 一 年 的 观测 数据 和 后 续 4 年 的 预测 值 ， 在 这 一 前 置 时 间 下 ， 易 见 预 
测 极限 越 来 越 宽 ， 这 源 自 预 测 中 较 大 的 不 确定 性 . 
图 表 10-17 对 CO: 模型 的 长 期 预测 


CO; 水 平 


2004 2005 2006 2007 2008 2009 
年 份 


> plot (ml.co2,nl=c(2004,1),n.ahead=48,xlab='Year',type='b', 
ylab='CO2 Levels') 
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10.6 小 结 


乘法 季节 ARIMA 模型 提供 了 一 种 经 济 的 方法 ,用 来 对 具有 季节 趋势 的 时 间 序 列 建 模 ， 这 
里 的 季节 性 趋势 不 具有 第 3 章 中 所 研究 过 的 确定 性 季节 趋势 模型 所 应 有 的 那 种 规则 性 . 所 幸 这 
类 模型 仅 是 特殊 的 ARIMA 模型 ,因此 研究 其 性 质 时 无 需 引 和 人 新 的 理论 本章 还 通过 对 一 个 实 
际 时 间 序 列 建 模 过 程 的 详尽 介绍 说 明了 该 类 模型 的 特性 . 


习题 
10.1 用 如 下 基于 季度 数据 的 季节 模型 拟 合 某 时 间 序 列 : 
Y, = Ye, te, — Aen. — fte 
(a) 求 此 模型 的 前 4 个 yy 权重 . 
(b) 假设 二 0.5，0, 二 一 0.25 Ho =1l. 如 果 最 后 4 个 季度 的 数据 如 下 ， 求 之 后 4 个 季 


度 的 预测 值 . 
季度 I I 亚 N 
序列 值 25 20 25 40 
GR PE 2 1 2 3 


(c) R (b) 部 分 中 预测 值 的 置信 度 为 95% 的 预测 区 间 . 
10.2 某 AR 模型 的 AR 特征 多 项 式 如 下 : 
(1—1. 6x +0.7x?)(1— 0. 8x”) 
(a) 此 模型 是 平稳 的 吗 ? 
(b) 证 明 此 模型 是 一 个 季节 ARIMA 模型 . 
10.3 假设 序列 CY.) 满足 
Y,=atbtt+S, +X, 
其 中 S, 是 一 个 周期 为 * 的 确定 性 周期 序列 ， 而 {X,) 是 一 个 季节 ARIMA(P, 0, gx 
(P, 1, Q), 序列 . WA W, =Y, 一 Y_-, 的 模型 为 何 ? 
10.4 季节 模型 Y, 二 BY, ,十 e. 一 9e:-1， 其 中 1B| 二 1, 求 7。 和 ps. 
10.5 证 明 下 面 的 模型 是 乘法 季节 ARIMA 模型 : 
(a) Y,=0. 5Y，; HY,- —0. 5Y,-5 te, — 0. 3e, 
(b) Y,=Y,-1 tY¥ 12 —Yi-12 +e, — 0. 5e,-1 — e,-12 +0. 25e,-13 
10.6 验证 公式 〈10. 2. 11). 
10.7 ”假设 过 程 {Y,} 满足 Y =Y.. +e, 4 t=1, 2, 3, 4 时 , Y,=@,. 
(a) R {Y,) 的 方差 函数 . 
(b) 求 {Y,} 的 自 相关 函数 . 
(c) 证 明 {Y,) 的 模型 是 季节 ARIMA 模型 . 
10.8 考虑 图 表 10-1 所 示 的 加 拿 大 阿 勒 特地 区 的 月 CO. 含量 时 间 序 列 . 数据 信息 详 见 文 
件 co2. 
(a) 用 带 有 线性 时 间 趋 势 的 确定 性 季节 均值 模型 拟 合 这 些 数 据 ， 模 型 中 所 有 回归 系数 里 
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有 没有 “统计 上 显著 的 ”? 

(b) 此 模型 的 多 重 尺 方 是 多 少 ? 

(c) 计算 此 模型 残 差 的 样本 自 相 关系 数 ， 并 解释 结果 . 

最 先 由 Box 和 Jenkins(1976) 研究 的 月 航线 客运 量 时 间 序 列 被 视 为 典型 的 时 间 序 列 ， 数 

据 详 见 文件 airline. 

Ca) 画 出 此 序列 的 原始 形式 和 取 对 数 形式 的 时 间 序 列 图 说明 对 数 变换 在 这 里 是 恰 
当 的 . 

(b》 画 出 并 解释 取 对 数 后 序列 的 一 次 差分 时 间 序 列 图 ， 

Cc) 画 出 并 解释 取 对 数 后 序列 经 一 次 差分 和 季节 差分 后 的 时 间 序 列 图 . 

(d) 计算 并 解释 取 对 数 后 序列 经 一 次 差分 和 季节 差分 后 的 样本 ACF. 

(e) H “MeN” (ARIMAO, 1, DXO, 1, De) 拟 合 对 数 化 的 序列 ， 

() 对 模型 及 其 自 相 关 性 和 残 差 的 正 态 性 进行 诊断 . 

(g) 假设 前 置 时 间 为 两 年 ， 对 此 序列 进行 预测 ， 并 要 求 给 出 预测 极限 . 


10.10 图表 5-8 显示 了 美国 的 月 发 电量 数据 ,我们 论证 过 对 数 变 换 对 建 模 有 利 ， 图 表 5-10 显 
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示 的 是 此 序列 的 一 次 差分 时 间 序 列 图 ， 数 据 详 见 文件 electricity. 

(a) 计算 此 对 数 化 序列 一 次 差分 后 的 样本 ACF， 在 图 表 中 能 看 到 季节 性 吗 ? 

(b) 画 出 此 对 数 化 序列 经 一 次 差分 和 季节 差分 后 的 时 间 序 列 图 ， 此 时 平稳 模型 适用 吗 ? 

(c) 画 出 此 对 数 化 序列 经 一 次 和 季节 差分 后 的 样本 ACK. 读者 对 发 电量 序列 还 能 提出 
其 他 模型 吗 ? 

美国 Johnson & Johnson 公司 于 1960 一 1980 年 间 每 股 收益 的 季度 数据 见于 文件 I FA, 

(a) 画 出 该 序列 及 其 取 对 数 后 的 时 间 序 列 图 ， 论 证 对 序列 进行 对 数 变换 的 必要 性 ， 

(b 序列 明显 是 非 平稳 的 .对 其 进行 一 次 差分 变换 并 画 出 序列 图 ， 现 在 序列 平稳 性 有 
无 合理 性 ? 

(c) 计算 并 画 出 经 一 次 差分 后 序列 的 样本 ACF， 并 人 解释 结果 . 

(Cd) 画 出 并 解释 经 过 一 次 差分 和 季节 差分 后 的 序列 图 . 牢记 季度 数据 一 季 的 长 度 为 4. 

(e) 画 出 并 说 明 经 过 一 次 差分 和 季节 差分 后 的 序列 的 样本 ACF. 

(fy WA ARIMA(0，1，1)X (0，1，1), 模型 ， 并 评估 系数 估计 值 的 显著 性 ， 

(g) 对 残 差 进行 所 有 的 诊断 性 检验 . 

Ch) 计算 并 画 出 序列 未 来 两 年 的 预测 值 ， 要 求 给 出 预测 极限 

文件 boardings 中 保存 的 是 2000 年 8 月 至 2005 年 12 月 间 在 美国 科罗拉多 州 的 丹佛 措 

PALE (多 乘 轻 轨 火 车 和 城市 巴士 ) 人 数 的 月 度数 据 . 

(a) 画 出 时 间 序 列 图 要求 使 用 有 助 于 评估 季节 性 的 绘图 符号 ， 应 用 平稳 模型 合理 吗 ? 

(b 计算 并 画 出 序列 的 样本 ACF. 当 汪 后 为 多 少时 ， 存 在 显著 的 自 相 关 性 ? 

(c) 为 数据 拟 合 一 个 ARMA(0，3) X (1，0)w4 模 型 .评估 系数 估计 值 的 显著 性 ， 

(d) ARMA(0，4) X (1，0)1s 模 型 是 过 度 拟 合 的 ， 解 释 这 一 结果 . 


ka 


Bus 时 间 序 列 回归 模型 


本 章 将 介绍 几 个 实用 的 在 时 间 序 列 建 模 中 纳入 外 部 信息 的 想法 . 首先 介绍 模型 包含 着 对 时 
间 序 列 正 向 行为 的 干预 影响 ， 继 而 考虑 一 类 会 有 有 异常 值 影响 作用 的 模型 ， 相对 于 序列 的 正常 行 
为 而 言 ， 异 常 值 是 一 种 异乎 寻 第 的 观测 值 ， 它 既 可 能 出 现 于 被 观测 序列 之 中 ， 也 可 能 出 现 于 误 
差 项 里 ， 最 后 ， 研 究 识别 和 应 对 伪 相 关 的 方法 一 一 所 谓 伪 相关 ， 是 指 序列 加 表现 出 虚假 的 相关 
性 ， 对 于 了 解 或 对 时 间 序 列 建 模 没 有 助 益 . 读者 会 发 现 ， 对 序列 进行 预 日 化 处 理 ， 有 助 于 找 出 
序列 之 间 的 那些 真正 有 意义 的 关系 . 


11.1 于 预 分 析 

图 表 11-1 显示 的 是 1996 年 1 月 至 2005 年 5 月 期 间 美 国 的 月 度 航空 客运 里 程 数 据 经 对 数 
变换 后 的 时 间 序 列 图 ， 这 里 显示 出 明显 的 季节 性 ， 所 反映 的 一 般 性 事实 是 ， 航 空 客运 量 通常 在 
夏季 月 份 及 12 月 份 的 节假日 期 间 偏 高 ， 而 在 冬季 月 份 偏 低 9. 同时， 总 体 上 说 ， 航 空 客 运 量 
大 致 呈 现 出 直线 上 升 的 趋势 ， 直 到 2001 年 9 月 份 出 现 了 突然 的 下 降 ， 导 致 这 一 又 降 的 原因 是 
2001 年 9 月 11 日 发 生 的 屎 怖 袭击 事件 ， 事 发 当天 ， 有 四 架 飞 机 遭 到 劫持 ， 其 中 三 架 撞 向 了 世 
界 贸 易 中 心 的 双子 塔 和 五 角 大 楼 ， 而 第 四 架 飞 机 在 宾 尹 法 尼 亚 州 的 乡间 坠毁 .这 一 慌 怖 袭击 事 
件 使 那 一 时 段 的 航空 客运 深 陷 萧 条 之 中 ， 但 随 着 时 间 的 推移 ， 航 空 客 运 量 逐 渐 恢 复 到 了 下 跌 前 
的 水 平 ， 这 是 导致 时 间 序 列 趋势 发 生变 化 的 干预 的 一 个 实例 

由 Box 和 Tiao (1975) 引信 的 干预 分 析 (Intervention Analysis) 提供 了 对 于 干预 影响 时 
间 序 列 的 效果 进行 评估 的 一 个 框架 ， 这 里 假设 干预 是 通过 改变 时 间 序 列 的 均值 函数 或 趋势 而 对 
过 程 施加 影响 的 .干预 既 可 以 是 自然 产生 的 ， 也 可 以 是 人 为 施加 的 ， 例 如， 某 一 特殊 年 份 的 极 
端 气候 将 会 导致 那 一 年 某 些 动物 种 群 的 数量 降 到 极 低 的 水 平 ， 也 可 以 预见 到 ， 遭 到 冲击 前 后 的 
年 度 种 群 数量 可 能 有 所 不 同 。 另 一 个 例子 是 ， 将 州 际 高 速 公路 的 时 速 限制 由 65 英里 /时 提高 到 
70 英里 /时 ， 会 大 大 增加 高 速 公 路 上 行驶 的 危险 性 ， 而 另 一 方面 ， 更 高 的 车 速 可 能 会 缩短 驾驶 
员 们 滞留 州 际 高 速 公 路 的 时 间 ， 因 此 提高 时 速 限 制 这 一 变化 所 产生 的 综合 效果 是 不 确定 的 ， 如 
要 研究 提高 时 速 限 制 所 带 来 的 影响 ， 也 许可 以 通过 分 析 某 一 事故 时 间 序 列 数据 的 均值 函数 来 实 
现 ; 例如 ， 在 州 际 高 速 公路 的 某 一 区 段 内 所 发 生 的 重大 车 祸 事故 的 季度 数据 ，( 注 意 ， 干 项 也 
可 能 会 改变 时 间 序 列 的 自 协 方差 函数 ， 但 这 里 不 考虑 此 种 可 能 . ) 

首先 考虑 简单 的 单一 干预 的 情况 ， 经 适当 变换 后 ， 时 间 序 列 CY.) 的 一 般 模 型 由 下 式 
给 出 ， 

Y,=m,+N, PS) nd le 

其 中 ，m, 代表 均值 函数 的 变化 ，N, 的 模型 是 ARIMA 过 程 ， 且 可 能 是 季节 过 程 。 过 程 {NN,} 
代表 着 未 受 干预 影响 的 基础 时 间 序 列 ， 称 作 自 然 过 程 或 无 扰 过 程 ， 它 既 可 能 是 平稳 的 ， 也 可 能 
是 非 平稳 的 ; 既 可 能 是 季节 性 的 ， 也 可 能 是 非 季 节 性 的 ,假设 时 间 序 列 在 时 刻 工 受到 干预 ， 


蝗 ” 在 习题 中 ,将 要 求 读者 在 一 个 全 屏 图 表 上 使 用 季节 绘图 符号 画 出 时 间 序 列 图 ， 以 使 季节 性 特征 显而易见 ， 
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即 假设 在 TAA, m 与 等 无 异 . 称 时 间 序 列 (Y tT) 为 预 干预 数据 ， 可 用 其 识别 无 扰 过 
程 N, 的 模型 . 


图 表 11-1 美国 航空 的 每 月 客运 里 程 : 1996 年 1 月 ~2005 年 5 月 


Log (HEHE) 


17.1 17.317.5 17.7 


1996 1998 2000 2002 2004 


> win.graph(width=4.875,height=2.5,pointsize=8) 
> data (airmiles) 
> plot (log (airmiles) , ylab='Log (airmiles) ',xlab='Year') 


基于 有 考察 价值 的 主题 ， 通 常 可 用 若干 参数 来 说 明和 干预 对 均值 函数 的 影响 ， 阶 梯 孙 数 就 是 
这 样 一 个 有 用 的 晒 数 : 


Si™ = a (111.23 
0 其 他 
也 就 是 说 ， 在 预 干预 期 间 Sm 等 于 0， 而 在 干预 之 后 SS ST 1. 脉冲 函数 
Be SP a5 (11. 1. 3) 


当 ; 一 工时 POO 等 于 1， 而 在 其 他 情况 下 PO 等 于 0， 换 言 之，P!'? 是 干预 发 生 时 间 的 指示 器 

或 虚拟 标志 变量 .如果 干 预 导 致 均值 函数 发 生 了 即时 且 永 久 性 的 偏 移 ， 那 么 偏 移 可 建 模 如 下 : 

= psi” (11. 1. 4) 

其 中 ,gw 表示 干预 所 致 均值 的 未 知 永 久 变 化 ， 检 验 w 是 否 等 于 0 类似 于 检验 来 自 于 两 个 总 体 

的 相互 独立 的 随机 样本 数据 的 总 体 均 值 是 否 相 同 ， 但 这 里 的 主要 区 别 是 ， 一 般 不 能 假定 干巴 

前 后 的 数据 是 相互 独立 且 同 分 布 的， 数据 内 在 具有 的 序列 相关 性 使 得 这 一 问题 更 为 有 趣 ， 同 

en 如 果 干 预 经 过 4 个 时 间 单 位 的 延迟 后 作用 才 显 现 ， 并 且 4 已 知 ， 那 

可 以 设 定 

m = oS | (11.1.5) 

在 实际 中 ， 干 预 可 能 只 是 逐渐 地 影响 均值 函数 ， 其 全 部 影响 作用 只 有 经 历 很 长 时 期 方 能 充分 体现 出 
来 ， 这 时 可 以 为 m, 建 立 一 个 AR() 类 型 的 模型 ， 其 误差 项 由 滞后 1 的 SE? 的 倍数 充任 : 


; m, = M H aS (11.1.6) 
其 初始 条 件 为 mm = 二 0， 经 适当 代数 运算 后 ， 可 让 
| a 1—6 t>T 
m, = l— ð | psy 
ae 


We, S HPAES l>o>o. AIA, t 足够 大 时 ，m: 趋 近 于 w/(1 一 人 )， 它 是 
均值 函数 最 终 的 变化 (增加 或 减少 ) Be. 当 1 一 6 7 一 0.5 时 ， 也 即 当 上 一 工 十 log(0.5)7log(6) 
时 ，m, 达 到 极限 变化 值 的 一 半 ， 持 续 时 间 log(0.5)/log(6) 称 作 干 预 效应 的 半 豪 期， 半衰期 越 


182 第 1] 章 


短 ， 系 统 将 会 越 快 地 达到 极限 变化 值 . 图 表 11-2 显示 了 作为 8 的 图 数 的 半 误 期， 表明 半 训 期 
随 着 8 的 增 大 而 增加 ， 事 实 上 ， 当 8 趋 近 于 1 时， 半衰期 将 变 得 无 限 大 . 
图 表 11-2 ”基于 有 阶梯 函 数 输入 的 AR (1) 过 程 的 半衰期 
3 0.2 0.4 0.6 0.8 0.9 1 
oe $e MH 0. 43 0. 76 1. 46 3.11 


6. 58 oo 


有 趣 之 处 在 于 当 85=1 ORE, Bent >T AG m =a T—2), HRD FE m =0. 
m 的 时 间 序 列 图 呈现 出 斜率 为 w 的 斜坡 形状 ， 这 意味 着 干预 发 生 之 后 ， 其 对 于 均值 函数 的 改变 
是 线性 的 ， 这 种 斜坡 效应 〈 带 有 一 个 时 间 单 位 的 延迟 ) 见 图 表 11-3c. 

短期 的 干预 效应 也 许可 以 用 脉冲 虚拟 变量 来 表示 : 


1 :=T 
me (11.1.8) 
P Ny 其 他 
例如 ， 如 果 干 预 只 在 := 工时 影响 均值 函数 ， 那 么 
m, = wP P (11.1.9) 
逐渐 消失 的 干预 效应 可 以 用 AAR (1) 类 型 的 模型 来 表示 
m, 一 dm, + wPr™ (11. 1. 10) 


也 就 是 说 ， 当 三 工时 mm 一 o87-…， 因 而 均值 瞬 变 了 w， 而 后 均值 的 变化 成 几何 级 数 以 同比 38 减 
小 ， 参见 图 表 11-4a， 通 过 将 脉冲 函数 滞后 ， 延 迟 的 变化 也 可 以 被 包括 进来 ， 例 如 ， 如 果 均 值 
的 变化 发 生 于 一 个 时 间 单 位 的 延迟 之 后 ， 且 该 效应 会 逐渐 消失 ， 则 可 规定 
m, = dm 十 aP Grki 
再 一 次 假设 初始 条 件 为 mo 一 0. 
采用 延迟 算 子 B 表示 SS 上述 模 型 很 有 用 ， 其 中 Bm =m- B BP =P. BA (1 一 6B) 
m, 二 wBP!”， 或 者 可 以 写作 


= 3 pm (11. 1.12) 
1— 3B ' | 


HERR U-BSP=P?, TSH SP = Pm. 


my 


图 表 11-3 ”有 关 阶 梯 响 应 干预 的 若干 常见 模型 (都 带 有 一 个 时 间 单位 的 延迟 ) 


T T T 
; iT) wB ' J oB iT} 
a) @BS, b) sn eae 


日 、 本 童 后 续 部 分 将 会 用 到 附录 DD 中 引信 的 延迟 算 子 ， 在 进一步 学 习 之 前 ,读者 可 回顾 该 附录 中 的 有 关内 容 . 
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可 将 若干 说 明 方法 结合 起 来 对 更 为 复杂 的 干预 效应 建 模 . 
例如 ， 


aB pyn 十 | 十 w: B Pn a se ee D 


描述 的 情况 见 图 表 11-4b， 其 中 an Mo. BRS, m 
B 


— (T) wi B (T) wz (T) 
m 一 an Pi? + Pi? + Pr (11. 1. 14) 


可 为 图 表 11-4c 中 所 示 的 情况 建 模 ， 其 中 o 和 ws 都 是 负数 .最 后 一 例 模 型 描述 了 一 种 有 趣 的 
情形 ， 即 某 种 特殊 的 促销 手段 可 能 激 起 抢购 狂潮 ， 正 是 开始 阶段 的 销售 过 于 火暴 ， 使 得 其 后 的 
需求 呈现 出 低迷 的 状态 .更 一 般 地 ， 可 用 ARMA 类 型 的 表达 式 建 立 均 值 函数 变化 的 模型 ; 


= w(B) (T) 
m, = SB (11. 1. 15) 


其 中 ，w(B) AB) 都 是 关于 B 的 多 项 式 . 因为 O—B)SP =P, HAX} m, 的 模型 可 以 
用 脉冲 或 阶梯 虚拟 变量 来 表示 . 


图 表 11-4 有 关 脉 冲 响 应 干预 的 一 些 常见 模型 (都 带 有 一 个 时 间 单 位 的 延迟 ) 


m, = 


二 一 一 一 一 一 一 w a ee tw: 0 
a E a w 
0 OMN "ee ee @, or a 
一 二 一 一 一 一 一 一 一 一 一 一 
T T T 
wB pr wB aE] m | wB a | m 
一 一 一 户 ) | P; ) | w+ 一 一 一 + P, 
a rT" 2e ETAD 18 ”| 9 1-68 1-8 


极 大 似 然 估 计 法 可 用 于 干预 模型 的 参数 人 和 估计， 事实 上 ，Y, 一 m, 是 一 个 季节 ARIMA 过 
程 ， 因 此 这 里 的 似 然 函 数 就 是 了 一 m，(t= 二 1，2，…，n) 的 联合 概率 密度 函数 . 该 联合 概率 
密度 函数 可 以 用 第 7 章 所 述 方法 计算 得 到 ， 或 者 也 可 用 附录 H 中 所 介绍 的 状态 空间 建 模 法 
得 到 . 

现在 回 到 每 月 航空 客运 里 程 的 数据 ， 如 前 所 述 ，2001 年 9 H HRH A eM RE 
徘徊 于 萧条 之 中 ， 该 干预 效应 可 用 在 2001 年 9 月 有 脉冲 输入 的 AR O) 过 程 来 表示 ， 这 一 意 
外 事件 对 航空 客运 量 即时 造成 了 一 种 强烈 的 激 冷 效应 。 因此， 对 此 干预 效应 (9. 11 效应 ) 建 
模 如 下 : 


= wy PD 十 村 


a B 

其 中 , TRÆ 20011 年 9 月 . 在 这 一 表示 中 ， a 代表 即时 的 9/11 效应 ， 且 当 & 之 1 时 ， 
an (on AER 9/11 效应 对 其 后 上 个 月 份 所 造成 的 影响 .这 里 还 需要 确定 基础 无 扰 过 程 的 季节 
ARIMA 结构 .基于 预 干 预 数 据 ， 暂 用 一 个 ARIMA (0，1，1)X(0，1，0)1: 模 型 表示 未 受 拢 
Witt; BAAR 11-5. 
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图 表 11-5 ” 预 干预 期 间 (1 一 B)(1 一 B”)Log( 航 空 客运 里 程 ) 的 样本 ACF 


ACF 


> acf (as. vector (diff (diff (window (log{airmiles),end=c(2001,8)), 
12))),1ag.max=48) 


对 拟 合 模型 的 模型 诊断 表明 ，、 模 型 需要 一 个 季节 MA) 系数 ， 并 且 在 1996 年 12 月 、 
1997 年 1 月 和 2002 Æ 12 月 时 存在 可 加 异常 值 . (后 面 将 对 异常 值 做 更 详尽 的 讨论 ; 这 里 的 
可 加 异常 值 可 看 成 是 对 某 些 具 有 脉冲 响应 函数 的 未 知性 质 的 干预 . ) 因此 ， 确 定 模型 为 一 个 
带 有 9/11 干预 效应 以 及 三 个 可 加 异常 值 的 ARIMA(0，1，1)X(0，1，1) 过 程 . 拟 合 模型 
概括 于 图 表 11-6 中 . 


图 表 11-6 ”对 数 化 航空 客运 里 程 的 干预 模型 的 估计 


6 & Dec96 Jan97 Dec02 wo w] we a 
0. 383 0. 650 0. 099 — 0. 069 0. 081 — 0. 095 —0. 27 0, 814 
(0. 093) (0. 119) (0. 023) (0. 022) 《0. 020) (0. 046) (0. 044) (0. 098) 


o? 估计 值 为 0.000 672, Xt BMRA = 219.99, AIC=— 423. 98 


> air.ml=arimax(log(airmiles) ,order=c(0,1,1), 
seasonal=list (order=c(0,1,1),period=12), 
xtransf=data. frame (I911=1* (seq(airmiles) ==69), 
I1911=1* (seq(airmiles) ==69)),transfer=list(c(0,0),c(1,0)), 
xreg=data. frame (Dec96=1* (seq(airmiles) ==12), 
Jan97=1* (seq(airmiles) ==13) ,Dec02=1* (seq(airmiles) ==84)), 
method='ML' ) 

> air.ml 


a #87, i . N 

模型 诊断 表明 ， 上 述 拟 合 模型 实现 了 对 数据 很 好 的 拟 合 . 显示 在 图 表 11-7 中 时 间 序 列 图 
里 的 空心 圆 点 代表 的 是 由 最 终 估计 模型 得 出 的 拟 合 值 ， 总 体 上 表明 了 模型 与 数据 之 间 存 在 很 好 
的 一 致 性 . 

据 拟 合 模型 估计 ，9 . 11 干预 效应 使 航空 客运 量 在 2001 年 9 H FET 31% = {1— exp(— 
0. 0949 一 0. 2715)}X100%, kA 份 之 后 航空 客运 量 下 降 了 {1 一 exp( 一 0.2715 X 0. 8139* )} X 
100%. PAS 11-8 描绘 的 是 9 。11 事件 对 航空 客运 量 所 造成 影响 的 估计 ， 如 图 所 示 ， 航 空 客运 量 
直到 2003 年 年 底 才 恢复 到 遭受 冲击 前 的 水 平 . 
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图 表 11-7 对 数 化 的 航空 客运 里 程 与 拟 合 值 


Log (客运 里 程 ) 
171 17.3 17.5 177 


1996 1998 2000 2002 2004 


年 份 
> plot (log (airmiles) ,ylab='Log (airmiles) ') 
> points (fitted{air.ml)) 


图 表 11-8 9.11 事件 对 航空 客运 量 序列 所 造成 影响 的 估计 


9.11 影 响 
-03 -02 -0.1 00 


1996 1998 2000 2002 2004 
年 份 
> Ninellp=1* (seq(airmiles) ==69) 
> plot (ts (Ninellp* (-0.0949)+ 
filter (Ninellp, filter=.8139,method='recursive', side=1)* 
(-0.2715) ,frequency=12, start=1996) ,ylab='9/11 Effects', 
type='h'); abline (h=0) 


11.2 异常 值 


所 谓 异 常 值 ， 指 的 是 一 些 不 规则 的 观测 值 ， 其 出 现 可 能 源 自 测量 误差 与 复制 误差 其 中 之 
一 ， 或 者 两 者 皆 有 ， 也 可 能 是 源 于 基础 过 程 发 生 了 罕 发 的 短期 性 变化 ， 对 于 时 间 序 列 而 襄 ， 可 
识别 的 异常 值 有 两 种 ， 即 可 加 异常 值 与 新 息 异常 值 ， 通 常 分 别 简 记 为 AO SIO. 如 果 基 础 过 
程 在 时 刻 荆 时 受到 了 可 辣 加 性 的 扰动 ， 那 么 此 时 就 会 出 现 可 加 异常 值 ， 因 此 数据 变 为 
Yi =Y, t+a,Pi” WEG 
其 中 (Y,) 代表 无 扰 过 程 . 在 本 节 接 下 来 的 内 容 中 ，Y 表示 受到 异常 值 影响 的 观测 过 程 ， 而 了 
代表 没有 异常 值 的 无 扰 过 程 ， 因 而 ，Y7= 二 Yr 十 wa， 其 余 情 况 下 Y, =Y, Min RAE FAE T 
时 刻 存在 一 个 可 加 异常 值 ， 那 么 意味 着 它 只 在 时 刻 械 受 到 影响 .可 加 异常 值 也 可 视 为 一 种 在 
时 刻 TT 上 具有 脉冲 响应 的 干预 ， 因 而 m 一 waPr”， 
另 一 方面 ， 如 果 处 于 时 间 t 时 的 误差 (也 称 为 新 息 ) 受到 了 扰动 〈( 即 误差 是 e =e, 十 
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oP", BtPe E-PSH HN AR AWE). PARC 时 就 会 出 现 一 个 新 息 异 常 值 ， 因 此 ， 
eT 二 er 十 wl:， 其 余 情况 下 e 一 ea， 假设 无 扰 过 程 是 平稳 的 ， 且 可 表示 成 MA(co) 的 形式 

Y, =e t reni F prem te 
因此 ， 受 到 扰动 的 过 程 可 以 写作 

Y, = e, +e Hiper +e = Le, + prem + deere to J+ bere 
或 者 是 
Y; =Y, 十 由 rm， (11. 2. 2) 
Hp go =1, Hj An py, =O. 因此 ， 即 便 随 着 观测 值 逐 渐 远 离异 常 值 的 发 生 点 扰动 效应 
ws. HA 了 的 新 息 异 常 值 仍 会 对 时 刻 了 了 及 其 后 的 所 有 观测 值 产生 扰动 . 
为 了 识别 一 个 观测 值 是 AO 还 是 ID， 用 无 扰 过 程 的 ARC) 表示 来 定义 残 差 : 

a, = Y| — mY 一 ToY， ;一 … (11. 2. 3) 
为 简化 起 见 ， 假 设 过 程 的 均值 为 零 ， 且 所 有 的 参数 已 知 ， 在 实际 中 ， 未 知 的 参数 值 由 其 估计 什 
替代 ， 这 些 估计 值得 自 可 能 受 扰 的 数据 ， 在 零 假 设 为 无 异常 值 和 大 样本 的 情况 下 ， 这 种 近似 奉 
代 对 下 述 检验 流程 的 有 效 性 的 影响 可 以 忽略 不 计 ， 如果 序列 只 在 时 刻 工 有 IO， 那 么 残 差 为 
ar= w ters 其 余 情 况 下 ad, SEn 因此 wi 可 由 w= ay 来 估计 ， 方差 等 于 o. A, 用 于 检验 
HA) T b IO 的 检验 统计 量 为 


Anr = 2 (11. 2. 4) 
ow 


当 零 假设 为 时 间 序 列 中 没有 异常 值 时 ， 检 验 统计 量 〈 近 似 地 ) 服从 标准 正 态 分 布 . 在 工事 先 
已 知 时 ， 确 定 观 测 值 为 异常 值 的 条 件 是 ,在 5 站 的 显著 性 水 平 上 相应 标准 残 差 的 大 小 超过 
1. 96， 实 际 中 往往 没有 关于 T 的 先 验 知识 ， 所 以 需 对 全 部 的 观测 值 进 行 检验 . 此 外 ， 还 需要 
估计 o。， 简 单 而 保守 的 做 法 是 应 用 Bonferroni 律 来 控制 多 重 检 验 的 总 体 误差 率 ， 今 

A 一 max |; | (11. 2.5) 
最 大 值 在 t= TRS. wa, 超过 了 标准 正 态 分 布 的 上 百 分 位 数 0.025/nX100， 那 么 第 工 
个 观测 值 必然 是 IO， 该 流程 确保 了 错误 认定 IO 的 概率 至 多 为 5%， 值 得 注意 的 是 ， 异 常 值 可 
能 会 导致 c 的 极 大 似 然 估计 值 偏 大 ， 因 此 车 不 对 其 加 以 调整 ， 则 大 多 数 检验 方法 的 效力 通常 都 
会 有 所 下 降 ， 为 增强 检验 的 有 效 性 ,或 许可 用 一 种 对 于 噪声 标准 差 的 稳健 估计 来 代替 极 大 似 然 


估计 ， 例 如 ， 可 用 残 差 的 绝对 均值 乘 以 /之 来 得 到 a 更 为 稳健 的 估计 . 
ie AO 更 为 复杂 ， 假 设 过 程 只 在 时 刻 工 上 存在 AO， 在 其 他 时 点 上 无 异常 值 ， 则 可 证 
a, =— watt t+ E, (11.2.6) 


Hp m= l1, 且 当 了 为 负数 时 t; —U, Ait, 4 <T Wf a,=e,, ar 王 wa 十 er， QT+41 = — war + 
€rii+ aTh: =~ WAN? terse s 并 以 此 类 推 . ca 的 最 小 二 乘 估 计量 为 


ora 一 一 在 Dj TTA ONT 
Heh P= Otit t et- ”，，、 而 估计 量 的 方差 为 po .那么 可 以 定义 
io (11. 2. 8) 


pe 


有 时间 序列 回归 模型 187 


为 检验 统计 量 ， 用 于 检验 零 假 设 为 时 间 序 列 中 无 异常 值 、 备 择 假 设 为 序列 有 一 个 在 工时 的 AO 
的 情况 . 如 前 ， 需 要 估计 p 和 .在 零 假 设 下 ， 检 验 统 计量 Ar MRM N (0，1) 的 分 布 . 
同样 ， 通 常 工 未 知 ， 需 要 重复 对 每 个 时 间 点 进行 检验 ， 再 次 用 Bonferroni 律 来 控制 总 体 误 差 
率 ， 此外， 异常 值 的 性 质 事先 无 从 得 知 . 当 在 时 间 工 上 检验 到 异常 值 时 ， 如 果 |Air| 二 |)zr|， 
则 可 将 观测 值 归 类 到 ID， 和 否则 就 是 AO. 另 一 种 对 异常 值 性 质 进 行 分 类 的 方法 可 参见 Chang 
等 人 的 研究 (1988)， 当 找 出 了 一 个 异常 值 后 ， 可 将 其 纳入 模型 中 ， 然 后 反复 对 修正 的 模型 进 
行 异 常 值 检 验 ， 直 到 不 再 发 现 新 的 异常 值 为 止 . 

作为 第 一 个 例子 ,仿照 $= 二 0.8,， 9 二 一 0.5 的 ARIMA(1，0，1) 模型 来 模拟 一 个 长 度 n= 
100 的 时 间 序 列 ， 然 后 将 第 10 个 观测 值 由 一 2. 13 变 为 10 CB wa 三 12.13); 参见 图 表 11-9. 
基于 样本 ACF, PACF 和 EACF， 可 以 暂时 辨识 为 AR(1) 模型 ， 基于 Bonferroni 律 ， 认 为 第 
9 个、 第 10 个 和 第 11 个 观测 值 可 能 是 可 加 异常 值 ， 其 相应 的 稳健 检验 统计 量 值 为 一 3. 54， 
9.55 和 一 5. 20。 对 于 10 的 检验 表明 ， 第 10 个 和 第 11 个 观测 值 可 能 是 ID， 其 相应 的 稳健 检验 
统计 量 的 值 为 7.11 和 一 6. 64， 由 于 在 所 有 的 AO 和 IO 检验 里 ， 检 验 统 计量 的 最 大 取 值 出 现在 
时 间 T=10 的 AO 检验 中 ， 因 而 暂 定 第 10 个 观测 值 为 一 个 AO. HMPA AO 的 非 稳 健 检验 统 
计量 在 T=10 时 等 于 7. 49， 大 大 小 于 更 为 稳健 的 检验 统计 量 的 取 值 9. 55， 这 表明 通过 提高 只 
声 标准 差 估计 量 的 稳健 性 确实 可 以 使 检验 的 效力 得 到 增强 .将 AO 纳入 模型 之 后 ， 未 再 发 现 更 
多 的 异常 值 ， 但 是 ， 江 后 1 的 残 差 ACF 是 显著 的 ， 表 明了 引入 MAO) 分 量 的 必要 性 . 至 此 ， 
已 为 数据 拟 合 出 了 一 个 在 T=10 时 有 AO 的 ARIMA(1，0，1) 模型 ， 该 模型 已 不 包含 任何 其 
他 的 异常 值 ， 且 通过 了 所 有 的 模型 诊断 性 检验 . 


图 表 11-9 ”模拟 出 的 具有 一 个 可 加 异常 值 的 ARIMA (1, 0, 1) 过 程 


A 


y 
20 24 6 8 10 


0 20 40 60 80 100 
时 间 


> The extensive R code for the simulation and analysis of this 
example may be found in the R code script file for Chapter 11. 


举 一 个 真实 的 例子 ， 回 到 第 10 章 中 为 二 氧化 碳 时 间 序 列 所 拟 合 的 季节 ARIMAO, 1, 1)X 
(0，1，1), 模 型 ， 示 于 图 表 10-11 中 该 模型 标准 残 差 的 时 间 序 列 图 在 1998 年 9 月 时 存在 着 一 
个 大 得 可 疑 的 标准 残 差 .计算 表明 ， 对 任何 t 而 言 ，:,, 都 不 是 一 个 明显 很 大 的 数值 ， 故 没有 存 
在 可 加 异常 值 的 迹象 . 但 是 ， 稳健 化 的 Al = max |A1. | = 3. 7527, 此 值 在 t=9357 时 取 到 ， 对 应 
于 1998 年 9 月 ， 当 a 二 5% 且 n= 二 132 H}, Bonferroni 临界 值 为 3. 5544， 因 而 41 的 值 已 足够 大 ， 
可 以 说 在 1998 年 9 月 明显 存在 一 个 新 息 异 常 值 ， 图 表 11-10 给 出 了 对 CO, 时 间 序 列 拟 合 的 在 :二 
57 时 有 一 个 IO 的 ARIMA(0，1，1)X(0，1，1)ww 模 型 .应 将 此 结果 与 之 前 示 于 图 表 10-10 中 的 
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结果 加 以 比较 ， 那 里 并 未 考虑 异常 值 的 问题 ， 值 得 注意 的 是 ，9 MO 的 估计 值 并 没有 发 生 很 大 
EE., m AIC 变 得 更 好 了 《 即 更 小 了 )， 而 且 IO 效应 是 非常 显著 的 .对 此 模型 的 诊断 结论 极 
好 ， 未 发 现 新 的 异常 值 ， 表 明 该 模型 非常 适合 此 季节 时 间 序 列 . 


图 表 11-10 CO, 序列 的 在 t=57 WE IO BY ARIMA (0，1，1)x (0，1，1)' 模 型 


x 数 g G 10-57 
Witt 0. 5925 0. B274 2.6770 
tp METRE 0. 0775 0. 1016 0. 7246 


g2=0. 4869， 对 数 似 然 值 一 一 133. 08, AIC=272. 16 


> ml.co2=arima(co2,order=c(0,1,1),seasonal=list (order=c(0,1,1), 
period=12)); ml.co2 

> detectAd (ml .co2); detectIO(ml.co2) 

> m4.co2=arimax{co2,order=c(0,1,1),seasonal=list (order=c(0,1,1), 
period=12) ,io=c(57)); m4.co2 


11.3 AHX 


建立 时 间 序 列 模型 的 一 个 主要 目的 就 在 于 预测 ， 而 ARIMA 模型 正 是 利用 数据 内 在 的 自 相 
关 模 式 达 到 的 ， 通 常 ， 所 研究 的 时 间 序 列 可 能 与 其 他 协 变 时 间 序 列 有 关 ， 或 者 受 其 引导 . 例 
如 ，Stige 等 (2006) 曾经 发 现 ， 非 洲 牧 草 产量 通常 与 某 些 气候 指标 密切 相关 ， 在 这 种 情况 下 ， 
通过 在 时 间 序 列 模型 中 纳入 相关 的 协 变 量 ， 将 有 晤 于 更 好 地 了 解 基础 过 程 以 及 /或 是 得 到 更 为 
准确 的 预测 . 

令 Y={ 记 为 应 变量 的 时 间 序 列 ，X={X,}) 为 协 变量 时 间 序 列 ， 希望 后 者 有 助 于 解释 Y 
或 对 Y 进行 预测 ， 为 了 探究 Y SX 之 间 的 相关 性 结构 及 其 主 从 关系 ， 对 每 对 整数 1 和 s 定义 互 
协 方差 函数 yy ,(X，Y)=Cov(X,，Y,)， 单 变量 时 间 序 列 的 平稳 性 概念 可 以 很 容易 地 扩展 到 多 
恋 量 时 间 序 列 的 情况 ， 例 如 , BX AY BRA GD 平稳 的 ， 只 要 其 均值 为 常数 ， 且 协 方 老 
y,.(X, Y) 是 关于 时 差 1 一 s 的 函数 ， 对 于 联合 平稳 的 过 程 而 言 ， 定 义 X 和 YY 在 滞后 & 的 互相 
ABA oX, Y) =Corr(X,, Y,-,.)=Corr(Xn., YD. HEB. MRY=X, PHARM 
恋 成 了 在 滞后 上 上 Y MBSR. AMY, X 度量 的 是 站 与 Y 间 的 同期 线性 联系 ， 而 
ao (X，Y) 度量 的 是 X, 与 Yt 之 间 的 线性 联系 ， 忆 及 自 相 关 函 数 是 偶 函 数 ， 即 oY, Y=. 
(Y, Y). (这 是 因为 ， 由 平稳 性 有 Corr(Y ，Y- =Corr(Y,4, Y,)=Corr(Y,, Yi44),) 但 因 
为 Corr(X,, Yin) 不 必 等 于 Corr(X,，Y,y4)， 所 以 互相 关 函 数 一 般 不 是 侦 晒 数 . 

作为 例证 ， 考 虑 下 述 回归 模型 : 

Y,=BRt+BRX-ate cli 
其 中 ， 所 有 的 XX 是 方差 为 oa 的 独立 同 分 布 的 随机 变量 ， 而 所 有 的 e 也 是 方差 为 a BER ea 
独立 于 X. 可 以 验证 ， 除 滞后 三 一 红外 互相 关 函 数 (CCF) aX, N EFTE., P 
= — E DEMA 
p_a XY) PET. ( 
在 这 种 情况 下 ， 只 有 当 灌 后 为 一 & 时 ， 理 论 上 的 CCF 才 是 非 零 的 ， 所 反映 的 事实 是 义 在 d 个 
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时 间 单 位 上 “引导 ”Y。， 可 用 如 下 和 定义 的 样本 互相 关 函 数 〈 样 本 CCF) 估计 CCF: 
(X,Y) A Oa =) 

> CX, — XF 4/3 (Y, LY) 
其 中 求 和 在 加 项 存在 的 所 有 数据 上 进行 。 当 Y= 二 XX 时， 样本 CCF 就 变 成 了 样本 ACF. BALK 
当 房 二 0 时 ， 协 变量 关 是 独立 于 Y iH, INRA Re, CX. Y 渐 近 服从 于 均值 为 零 、 
方差 为 1/n 的 正 态 分 布 ， 其 中 是 样本 容量 一 一 即 有 (X,，Y,〉 对 的 个 数 ， 幅度 大 于 1. 96/Yn 
的 样本 互相 关系 数 必然 是 显著 异 于 零 的 . 

通过 方程 (11. 3. D 定义 的 模型 (其 中 d= 二 2, P=OHB=l) 模拟 出 了 100 个 (Xo Y) 
对 . 所 有 的 X 和 e 分 别 来 自 服从 于 NC(0,，1) MNO, 0.25 分 布 的 正 态 随机 变量 .理论 上 ， 
CCF 应 为 零 ， 除 在 滞后 为 一 2 时 等 于 po-:(X，Y) =1/ v1 十 0. 25=0. 8944. RX 11-11 显示 的 
是 模拟 数据 的 样本 CCF ， 其 在 滞后 为 一 2 和 3 时 是 显著 的 ， 但 在 滞后 为 3 时， 样本 CCF 的 值 很 
小 ， 且 只 是 边缘 显著 这样 一 种 虚假 的 警报 并 不 出 乎 意料 ， 因 为 图 表 中 总 共 显 示 出 了 33 个 样 
本 CCF 的 值 ， 预 计 其 中 平均 会 出 现 33X0. 05=1. 65 个 虚假 的 告警 . 


图 表 11-11 由 d=2 的 方程 (11. 3. 1) 得 出 的 样本 互相 关 图 


(11. 3. 3) 


0.6 


CCF 


eo — e er eee ee 一 一 一 一 一 ee EE ae e e l 


HHA 


> win.graph (width=4.875,height=2.5,pointsize=8) 

> set.seed(12345); X=rnorm(105); Y=zlag(X,2)+.5*rnorm(105) 

> X=ts(K[-(1:5)],start=1,freq=1); Y=ts(¥[-(1:5)],start=1, freq=1) 
> ccf (X,Y,ylab='CCF') 


— r 


即使 X5 Y, WK, AA XAY 每 个 都 是 白 噪声 序列 ， 所 以 上 述 回 归 模 型 的 局 限 性 还 是 
很 大 ， 一 般 对 于 平稳 时 间 序 列 而 言 ， 应 变量 和 协 变 量 各 自 都 是 自 相 关 的 ， 而 且 回归 模 型 的 次 老 
项 也 是 自 相 关 的 ， 因 此 ， 可 给 出 一 个 更 为 有 用 的 回归 模型 ， 

Y,= 久 十 Xs 二 22 Clie ) 
其 中 ，Z 满足 某 一 ARIMA(p，d，g) 模型 ， 即 使 过 程 X 和 YY 彼此 独立 (8-0), We x A 
Y 中 的 自 相 关 性 也 将 导致 不 利 的 结果 ， 即 意味 着 样本 CCF 不 再 渐 近 服从 于 N(0，1/n) 的 分 
布 ， 在 假设 过 程 Xx 和 YY 都 是 平稳 的 且 彼 此 相互 独立 的 前 提 下 ， 样 本 方差 将 趋 于 异 于 1/n WE. 
PRE, UESN. (X, Y) 的 方差 渐 近 等 于 

1+2 ,p(X) plY) CS 


Ep, aO 表示 在 滞后 上 上 X 的 自 相 关系 数 ， 而 p.(Y) 亦 如 是 定义 于 Y 过 程 ， 对 此 渐 近 结果 


的 改进 ， 参 见 Box (1994, 413 T). Bi X MYRE ARO) WH, H ARO) 系数 分 别 为 办 
与 加， 那么 nX., Y) 渐 近 服从 于 均值 为 零 的 正 态 分 布 ， 但 此 时 的 方差 近似 等 于 
1 + $x$y _ 
n(1— prpy) 

当 两 个 AR(1) 系数 都 接近 于 1 时 ，r(X，Y) 的 样本 方差 与 名 义 量 值 1/n 的 比率 趋 于 无 
穷 大 ， 因 此 ， 与 应 用 名 义 5 站 的 误差 率 作 为 判定 标准 相 比 ， 即 使 在 应 变量 和 协 变量 相互 独立 的 
情况 下 ， 不 加 质疑 地 应 用 此 1/n 规则 来 判定 样本 CCF 的 显著 性 也 可 能 会 导致 更 多 的 错误 判断 . 
图 表 11-12 显示 的 是 该 例 的 若干 数值 结果 ， 其 中 bx = by = 9. 


图 表 11-12 为 一 对 AR (1) 过 程 所 进行 的 名 义 5% 的 独立 性 检验 的 渐 近 误差 率 


(11. 3. 6) 


% 一 gx = fy 0. 00 0.15 0. 30 0. 45 0. 60 0.75 0. 90 
误差 率 5% 6% 7% 11% 18% 30% 53% 


> phi=seq(0,.95,.15) 

> rejection=2* (1-pnorm(1.96*sqrt ((1-phi*2) /(1+phi*2)))) 
> M=signif (rbind (phi, rejection) ,2) 

> rownames(M)=c('phi', ‘Error Rate') 

> M 


对 于 非 平稳 数据 而 言 ， 样 本 互相 关系 数 方差 偏 大 的 问题 更 为 严重 ， 事 实 上 ， 即 使 在 大 样本 的 情 
况 下 ， 样 本 互相 关系 数 可 能 也 不 再 近似 地 服从 于 正 态 分 布 了 ， 图表 11-13 中 的 直方 图 描绘 的 是 模拟 
的 两 个 独立 过 程 的 1000 个 滞后 为 零 的 互相 关系 数 ， 这 两 个 过 程 都 是 样本 容量 为 500 的 IMAC, 1) 
过 程 ， 这 两 个 模拟 的 过 程 都 用 到 了 b=-0.8 的 MAC) 系数 .注意 ，r。(X，Y) 的 分 布 远 非 正 态 ， 且 
其 值 广泛 地 散布 于 一 1 和 1 之 间 . 相关 的 理论 性 探讨 参见 Phillips (1998). 


MSE 11-13 “关于 两 个 样本 容量 都 为 500 的 独立 IMA (1, 1) 过 程 的 1000 个 零 时 滞 样 本 互相 关系 数 直方 图 
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set .seed (23457) 

correlation.v=NULL; B=1000; n=500 

for (i in 1:8) {x=cumsum(arima.sim(model=list (ma=.8),n=n)) 

y=cumsum (arima.sim(model=list (ma=.8),n=n) ) 

correlation. v=c(correlation.v,ccf (x, y,lag.max=1, 
plot=F) $acf [2] ) } 

hist (correlation.v, prob=T,xlab=expression (r[0] {X,Y))) 


VY VY VY VV Nv 


Vv 


BL ES SIR al HB as T AA et Ze Fe an BE Ta] RE BH) BES ee Ta] re BY (fh) 相关 关系 . Yule 
(1926) 最 里 对 伪 相 关 (Spurious Correlation) 现象 作出 了 系统 的 研究 . 
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作为 一 个 例子 ,， 将 1994 年 1 月 至 2005 年 12 月 间 美 国 每 月 牛奶 Cmilk) 产量 和 对 数 化 的 
每 月 发 电量 〈eleetricity) 数据 显示 在 图 表 11-14 中 ， 这 两 个 序列 都 呈现 出 了 向 上 的 趋势 和 显 
著 的 季节 性 特征 . 
图 表 11-14 ”美国 月 牛奶 产量 和 对 数 化 的 月 发 电量 数据 


和 牛奶 


1300 1700 


Log 《发 电量 ) 


[2.4 12.7 


1994 1996 1998 2000 2002 2004 2006 
年 份 


> data (milk); data (electricity) 
> mMilk.electricity=ts.intersect (milk, log(electricity) ) 
> plot (milk.electricity, yax.flip=T) 


计算 显示 ， 这 两 个 序列 在 滞后 为 零 时 的 互相 关系 数 为 0.54， 经 1. 96//n=0. 16 标准 误差 
准则 判定 ， 此 系数 是 “统计 上 显著 异 于 零 的 "图 表 11-15 显示 ,在 众多 滞后 上 这 两 个 变量 之 
间 存 在 强 互 相关 性 . 
图 表 11-15 ”美国 月 牛奶 产量 序列 与 对 数 化 的 月 发 电量 序列 的 样本 互相 关 图 
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> ccf (as.vector (milk.electricity[,1]), 
as.vector(milk.electricity[,2]),ylab='CCF') 


考 庸 著述 ， 很 难 合理 解释 月 发 电量 和 月 牛奶 产量 之 间 存 在 着 相关 关系 ， 二 者 的 非 平 稳 性 极 
可 能 是 导致 它们 之 间 出 现 伪 相关 的 原因 . 对 此 例 深入 的 探讨 将 留待 后 绊 章 广 进 行 . 
11.4 预 白 化 与 随机 回归 


在 上 一 节 中 我 们 发 现 ， 对 于 具有 强 自 相关 性 的 数据 而 言 ， 很 难 评估 两 个 过 程 之 间 是 否 存 在 依赖 
关系 ， 因 而 ， 宜 将 X MY 之 间 的 线性 关联 从 其 各 自 的 自 相关 关系 中 剥离 出 来 ， 预 白化 正 是 达 此 目的 
的 一 个 有 用 的 工具 .前 已 述 及 ， 对 于 相互 独立 的 平稳 序列 六 和 Y MK, aX D 的 方差 近似 为 


i+ Daa) (11.4. 1} 
n k=l 
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对 此 公式 的 考察 揭示 了 如 果 X 与 了 之 中 的 任意 一 个 〈 或 两 者 都 是 ) GRP. RAMS 
就 等 于 1/n， 在 实际 中 ， 数 据 可 能 是 非 平 稳 的 ， 但 用 拟 合 ARIMA 模型 的 残 差 蔡 代数 据 后 ， 可 以 
将 其 转换 成 近似 的 白 品 声 序列 .例如 ， 若 天 满足 无 截 臣 项 的 ARIMA (1, 1, 0) 模型 ， 则 

X, = X,-—X-1 —#(X.. — Xe.) = [1-1 +p) B + $B" 1X, (11. 4. 2) 
是 白 噪声 。 更 一 般 地 ， 如 果 X 满足 某 可 逆 ARMAC, d, q) 模型 ， 那 么 它 就 有 ARCO) 表示 

X. = (1—mB—xB —)X, = x(B)X, 

Ep, X EHRE. AHERE nB) 一 1 一 mm B 一 心怀 一 … 将 瑟 转 换 为 X 的 过 程 ， 称 为 白化 或 预 自 


化 ， 现 在 ， 通 过 使 用 基于 和 过 程 的 同一 滤波 器 将 Y 入 预 白化 ， 然 后 计算 Y 和 义 〈 即 预 白 化 后 的 Y 
和 X) 的 CCF， 即 可 研究 X MY jay CCF 了 ， 由 于 预 白化 是 一 种 线性 运算 ， 故 预 白化 后 原始 序列 
之 间 的 任何 线性 关系 都 可 保留 下 来 ， 注 意 这 里 混用 了 有 关 术 语 ，、 因 为 了 不 必 是 白 噪声 ， 原 因 在 于 为 
多量 身 定制 的 滤波 器 (B) 只 用 来 将 壬 转化 为 白 噪 声 过 程 -一 一 而 非 为 了 科 进一步 假定 Y 是 平稳 
的 ， 该 方法 有 两 个 优点 : O 运用 截断 的 1. 96/Yn， 可 以 评价 预 白 化 数据 样本 CCF 的 统计 显著 性 ， 
而 且 Gi) 如 此 佑 出 的 CCF 所 对 应 之 理论 值 与 某 些 回归 系数 成 比例 . 

为 了 说 明 (ii)， 考 虑 一 个 能 够 将 X SY 相关 联 的 更 一 般 的 回归 模型 ， 不 失 一 般 性 ， 假 设 


Y, 一 >》 有 8X +Z (11. 4. 3) 


其 中 义 是 独立 于 Z 的 ， 且 系数 8 确保 了 过 程 定义 的 完备 性 ， 模 型 中 ， 对 于 任 一 整数 &， 系 数 
可 以 非 零 ， 但 在 实际 应 用 中 ， 双 向 无 限 和 通常 变 为 有 限 和 ， 因 此 模型 可 简化 为 


mg 
Y, = PAX +Z, (11. 4. 4) 


下 文 均 如 是 假定 ， 尽 管 为 说 明之 便 ， 仍 保留 了 双向 无 限 和 的 记号 形式 ， 如果 求 和 范围 只 涵盖 茶 
正教 指标 的 有 限 集 合 ， 那 么 X 前 置 于 了 Y， 且 协 变量 X 可 作为 未 来 Y 值 的 有 用 的 前 置 指示 符 ， 
在 模型 的 两 边 同 时 应 用 滤波 器 x(8)， 得 到 

人 和 ye + Z, (10.4.5) 


Hh Z=Z—mZ1—-mZ.—. ARERR X 的 各 滞后 项 进行 了 正 交 化 


由 于 文 是 白 噪 声 序列 且 独 立 于 2， 故 广 和 YY 之 间 时 滞 为 上 的 理论 互相 关系 数 等 于 B_e(ox /or )， 换 吾 
之 ， 预 白化 后 的 过 程 在 时 滞 为 上 时 的 理论 互相 关系 数 与 回归 系数 8_: 成 比例 ， 

作为 快速 的 初步 分 析 ， 先 将 数据 进行 一 次 差分 (如 果 有 必要 )， 然 后 为 数据 拟 合 近 似 AR 
模型 ， 模 型 阶 数 通过 极 小 化 AIC 来 确定 ， 如 此 易 得 近似 的 预 白化 处 理 . 例 如， 就 牛奶 产量 和 
耕 电量 数据 而 言 ， 二 者 都 有 明显 的 季节 性 上 且 含 有 趋势 ， 先 对 它们 应 用 普通 差分 和 季节 差分 ， 然 
后 把 与 差分 后 的 牛奶 产量 序列 相 拟 合 的 AR 模型 作为 滤波 器 应 用 于 两 个 差分 后 的 序列 ， 如 此 即 
空 成 了 对 它们 的 预 白化 处 理 ， 图 表 11-16 显示 的 是 预 白化 后 序列 间 的 样本 CCF. pr TR i 
一 3 时 仅 具 边 缘 显 著 性 以 外 ， 此 时 没有 一 个 互相 关系 数 是 显著 的 .由 于 预计 在 这 给 出 的 35 个 样 
本 互相 关系 数 中 大 约会 出 现 1. 75 个 虚假 警报 ， 此 单独 的 显著 互相 关系 数 极 可 能 就 是 一 个 假 告 
营 ， 如 此 看 来 ， 牛 奶 产量 序列 与 耗 电量 序列 实际 上 是 基本 不 相关 的 ， 从 而 之 前 在 原始 数据 序列 
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中 发 现 的 强 互相 关 模 式 的 确 是 伪 相 关 . 
图 表 11-16 预 白 化 的 牛奶 产量 和 发 电量 序列 的 样本 COF 


0.2 


CCF 
-0.2 -0.1 0.0 9.1 


> me.dif=ts.intersect (diff (diff(milk,12)), 
diff (diff (log(electricity) ,12))) 

> prewhiten(as.vector(me.dif[,1]}),as.vector(me.dif[,2]), 
ylab='CCF') 


由 公式 (11. 3. 4) 定义 的 模型 在 不 同 场合 分 别称 为 传递 函数 模型 、 分 布 滞后 模型 或 动态 回 
归 模 型 ， 为 了 确定 应 将 协 变量 的 哪些 滞后 项 纳入 到 模型 之 中 ， 通 常 要 考察 基于 预 白 化 数据 的 样 
本 互相 关 函 数 以 找寻 依据 ， 当 模型 看 起 来 需要 协 变量 的 很 多 个 滞后 项 时 ， 可 能 需要 供 助 失 似 二 
预 分 析 中 用 过 的 ARMA 表达 形式 简约 地 来 确定 模型 的 回归 系数 ; 详 见 Box 等 人 的 研究 
(1994， 第 11 章 )， 下面 以 两 个 例子 来 说 明 该 方法 ， 对 这 两 例 的 模型 而 言 ， 看 上 去 都 只 需 用 到 
协 变量 的 一 个 滞后 项 .可 用 前 面 章 节 中 所 述 方法 ， 考 察 了 对 X 的 普通 最 小 二 乘 拟 合 〈OLS) 
的 残 差 来 确定 随机 噪声 过 程 2,. 

本 节 第 一 个 例子 引用 了 新 西 兰 Bluebird 食品 有 限 公 司 所 生产 的 某 种 炸 昔 片 的 销售 量 与 价格 的 数 
据 集 ， 数 据 集 包含 了 1998 年 9 月 20 日 至 2000 年 9 月 10 日 这 104 周 的 时 段 内 关于 大 包 标 准 炸 暮 片 销 
量 的 经 对 数 变换 后 的 周 销售 数据 ， 以 及 周平 均 销 售 价格 的 数据 ; 参见 图 表 11-17. 这 里 所 做 的 对 数 
变换 是 必要 的 ， 因 为 销售 量 数据 的 图 形 有 严重 向 右 偏 斜 的 趋势 . 这 些 数 据 明 显 是 非 平 稳 的 .如 图 表 
11-18 所 示 ， 对 数据 施行 差分 和 预 白化 处 理 后 ，CCF 只 在 时 滞 0 处 是 显著 的 ， 这 表明 在 滞后 1 期 的 
价格 和 销售 量 之 间 存 在 着 很 强 的 同期 负 相关 关系 ， 即 提高 销售 价格 将 导致 销售 量 的 下 降 . 


图 表 11-17 Bluebird HHA NA Log( 销 售 量 ) 与 价格 数据 


销售 量 
100 300 


1.2 1.6 2.0 


价格 


> data (bluebird) 
> plot (bluebird, yax.flip=T) 
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图 表 11-18 Bluebird 炸 暮 片 经 差分 和 预 白 化 后 的 周 Log( 销 售 量 ) 序列 与 价格 序列 的 样本 互相 关 图 


=e EK Se rr ey T= 


0.2 


—_ a: ci Dnis iini pami anj; a l ii = T e r m e E E E r ‘a pee p ee j ee ee. 


ce 
-0.6 -0.4 -0.2 0.0 


-15 -10 -5 0 5 10 15 


i JE 


> prewhiten (y=diff (bluebird) [,1] ,x=diff (bluebird) [,2],ylab='CCF') 


图 表 11-19 给 出 了 对 数 化 的 销售 量 对 价格 进行 OLS 回归 后 得 出 的 估计 .而 此 模型 的 残 差 
是 自 相 关 的 ， 分 别 观 察 图 表 11-20 和 图 表 11-21 中 的 其 样本 ACF H PACF 即 可 看 出 ， 事实 上 ， 
残 差 的 样本 自 相关 性 显著 表现 在 其 前 四 个 滞后 项 之 间 ， 而 其 样本 偏 自 相 关 性 却 在 洁 后 项 1，2， 
4 和 14 之 间 表 现 得 尤为 显著 . 


图 表 11-19 ”Log{ 销 上 售 量 ) 对 价格 的 OLS 回归 估计 


ii iHi 标准 误差 ffi Pri) 
WE 15. 90 0. 2170 73. 22 <0. 0001 
Aft Re = 7, 489 0. 1260 — 19. 75 < 0. 0001 


> sales=bluebird[,1]; price=bluebird[, 2] 
> chip.ml=1m(sales~price, data=bluebird) 


> summary (chip.m1) 
EE E 


图 表 11-20 Log( 销 售 量 ) 对 价格 的 OLS 回归 残 差 的 样本 ACF 


> acf (residuals (chip.m1) ,ci.type='ma') 
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图 表 11-21 Log( 销 售 量 ) 对 价格 的 OLS 回归 残 差 的 样本 PACF 


偏 ACF 


> pacf (residuals (chip.m1)) 


图 表 11-22 中 所 示 的 残 差 样本 EACF 包含 着 一 个 以 (1 ，4) 为 顶点 的 零 值 三 角形 ， 从 而 表 
明 其 为 一 个 ARMA(1，4) 模型 ， 因 此 ， 可 将 对 数 化 销售 量 拟 合 成 对 于 价格 序列 的 带 有 AR- 
MA(1，4) 误差 的 回归 模型 . 


图 表 11-22 Log( 销 售 最) 对 价格 的 OLS 回归 残 差 的 样本 EACF 


AR/MA g l 2 3 4 5 7 8 9 10 11 12 13 

D x x x x 0 0 x x 0 0 0 0 0 0 
1 x 0 0 x 0 0 0 0 0 0 0 0 0 0 

2 x x 0 x 0 0 0 0 0 0 0 0 0 0 

3 x x 0 x 0 0 0 0 0 0 0 0 0 0 

4 0 x x 0 0 Q 0 0 0 0 0 0 0 0 

5 x x x 0 x 0 0 0 0 0 0 0 0 

6 x x 0 x x x 0 0 0 0 0 0 0 0 

7 x 0 x 0 0 0 0 0 0 0 0 0 0 0 


> eacf (residuals (chip.ml)) 
结果 显示 ，AR(1) 系数 与 MA RAO, h 的 估计 值 都 不 显著 ， 因 此 随后 拟 合 的 模型 中 将 
这 些 系数 设 定 为 零 ， 见 图 表 11-23. 
图 表 11-23 MA MA(4) 误差 项 子 集 的 Log( 销 售 量 ) 对 价格 之 回归 模型 的 极 大 似 然 估计 


参数 6; Oe 8; a; 截 距 价格 
{hit fi 0 — 0. 2884 0 一 0. 5416 15. 86 — 2. 468 
标准 误差 0 0. 0794 0 0.1167 0. 1909 0.1100 


o 估计 值 为 0.026 23, MAMA A=—41.02, AIC=—70. 05 


> chip.m2=arima(sales,order=c(1,0,4) ,xreg=data. frame (price) ) 

> chip.m2 

> chip.m3=arima (sales, order=c(1,0,4),xreg=data.frame (price), 
fixed=c (NA,0,NA,0,NA,NA,NA)); chip.m3 

> chip.m4=arima (sales, order=c(0,0,4) ,xreg=data.frame (price), 
fixed=c(0,NA,0,NA,NA,NA)); chip.m4 
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注意 、 这 里 价格 回归 系数 的 估计 与 之 前 得 自 OLS 回归 拟 合 的 结果 相似 ， 但 估计 的 标准 误 
差 比 用 简单 OLS 回归 所 得 结果 大 约 低 10%. 这 阐明 了 如 下 的 一 般 性 结论 ， 即 简单 OLS 估计 量 
具有 一 致 性 ,但 相关 联 的 标准 误差 一 般 却 是 不 可 靠 的 . 

除 残 差 ACF 在 滞后 14 处 仍 是 显著 的 情况 以 外 ， 此 拟 合 模 型 的 残 差 大 体 上 通过 了 各 种 模型 
诊断 性 检验 ， 因 此 ， 当 检验 将 残 差 自 相 关 在 灌 后 14 或 更 多 沾 后 点 考虑 在 内 时 ， 某 些 Box- 
Ljung 检验 统计 量 存在 邻近 0. 05 的 p 值 ， 尽 管 滞后 为 14 的 ACF 的 显著 性 可 能 意味 着 季度 影 
响 的 存在 ， 我 们 仍然 不 会 取 包 含 沾 后 为 14 的 更 为 复杂 的 模型 ， 原 因 是 O) 14 周 不 是 严格 意 
义 上 的 一 个 季度 ， 而且 (2) 在 模型 诊断 意义 上 ， 加 入 一 个 周期 为 14 的 季节 MAC) 部 分 只 能 
起 到 微不足道 的 改善 作用 . 

第 二 个 例子 研究 汽油 价格 提升 对 公共 交通 工具 使 用 的 影响 .数据 集 的 时 间 跨 度 自 2000 年 
8 月 至 2006 年 3 月 ， 取 值 来 自 美国 科罗拉多 州 丹佛 地 区 ， 包 括 每 月 公共 交通 工具 的 载 客 量 数 
据 以 及 该 地 区 月 均 汽 油价 格 数据 .这 两 组 变量 都 有 向 右 方 偏 斜 的 趋势 ， 因 此 需要 对 其 施行 对 数 
变换 .如 下 所 见 ， 对 数 变换 还 有 助 于 更 好 地 对 最 终 拟 合 模型 进行 解释 . 如 图 表 11-24 中 的 时 间 
序列 图 所 示 ， 两 个 变量 序列 都 包含 着 递增 的 趋势 ， 且 载 客 量 数据 呈现 出 季节 性 波动 的 特征 ， 基 
于 样本 ACF 和 PACF, H ARIMA(2，1，0) 模型 拟 合 汽油 价格 序列 ， 继 而 如 图 表 11-25 所 
示 ， 在 计算 载 客 量 的 样本 CCF 之 前 ， 先 用 该 模型 对 载 客 量 数据 进行 过 滤 ， 样本 CCF 在 滞后 0 
和 15 上 是 显著 的 ， 这 表明 在 汽油 价格 和 公共 交通 工具 载 客 量 之 间 存 在 着 正 向 的 同期 相关 关系 ， 
(AEE, WG 15 上 CCF 的 显著 性 不 可 能 有 真实 性 ， 因 为 很 难 想象 载 客 量 能 引导 15 个 月 之 后 的 
汽油 价格 走势 、 在 这 种 情况 下 ， 通 过 拟 合 长 期 AR 模型 来 对 序列 进行 预 白化 ， 经 过 这 样 一 种 快 
速 先 期 处 理 ， 可 表明 没有 一 个 CCF 是 显著 的 . 结果 是 ， 即 使 对 数据 进行 了 差分 处 理 ，AIC HH 
选 出 的 仍然 是 一 个 AR(16) 模型 .选择 如 此 高 的 阶 数 ， 加 上 相对 较 短 的 时 间 跨 度 ， 有 可 能 实 
质 性 地 削弱 模型 对 两 个 变量 间 相 关 关 系 的 识别 能 力 . 一 个 意外 收获 是 ， 此 例 警示 不 能 仅仅 依赖 
AIC 来 选择 高 阶 AR 模型 来 进行 数据 的 预 白 化 ， 尤 其 在 处 理 时 间 跨 度 相 对 较 短 的 时 间 序 列 时 更 
要 加 以 注意 . 


图 表 11-24 2000 年 8 月 ~2006 年 3 月 间 丹 佛 地 区 月 公共 交通 工具 载 客 量 对 数 化 数据 和 汽油 价格 数据 


Log ($k & ) 
12.40 12.60 


48 54 
Log (价格 》 


2001 2002 2003 2004 2005 2006 
年 份 


> data (boardings) 
> plot (boardings, yax.flip=T) 
OS 
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图 表 11-25 预 自 化 后 的 Log{ 载 客 量 ) 与 Log( 价 格 ) 序列 的 样本 CCF 


CCF 


> ml=arima (boardings[,2] ,order=c(2,1,0)) 
> prewhiten(x=boardings[,2] ,y=boardings[,1] ,x.model=m1) 


根据 所 建 载 客 量 关于 汽油 价格 的 线性 模型 之 残 差 的 样本 ACF, PACF 和 EACF， 可 暂 定 回 
归 模 型 的 误差 项 过 程 为 季节 ARIMA(2, 0, OXA, 0, Or. 但 由 于 系数 和 的 估计 值 并 
不 显著 ， 需 调 降 AR 阶 数 至 p=1. M11. 2 节 中 讨论 过 的 异常 值 检验 方法 ， 可 在 2003 年 3 月 时 
找到 一 个 可 加 异常 值 ， 在 2004 年 3 月 时 找到 一 个 新 息 异 常 值 ， 由 于 可 加 异常 值 检验 统计 量 的 
大 小 超过 新 息 异 常 值 检验 统计 量 (分 别 是 一 4. 09 及 3. 65)， 这 里 将 可 加 异常 值 纳入 模型 *， 对 
所 得 拟 合 模型 的 诊断 显示 ， 残 差 ACK 在 滞后 3 处 是 显著 的 ， 这 意味 着 误差 项 过 程 是 一 个 带 有 
异常 值 的 季节 ARIMA(1，0，3)X(1，0，0) 过程 ， 鉴 于 系数 MO 的 估计 值 并 不 显著 ， 故 
未 将 其 纳 人 示 于 图 表 11-26 里 最 终 的 拟 合 模型 之 中 、. 

图 表 11-26 #5 ARMA 误差 项 的 Log( 载 客 量 ) 对 Log( 价 格 ) 回归 模型 的 极 大 似 然 估 计 


参数 $ Os P ai Logt ft #4) 异常 值 
估计 和 值 0. 8782 0. 3836 0. 8987 12.12 0. 0819 — 0. 0643 
bp MEIR 0. 0645 0. 1475 0. 0395 0. 1838 0. 0291 0. 0109 


估计 值 为 0.000 4094, WAA A= 158. 02, AIC= — 304. 05 


> log.boardings=boardings[,1] 

> log.price=boardings [, 2] 

> boardings.mi=arima(log.boardings,order=c(1,0,0), 
seasonal-list (order=c(1,0,0),period=12), 
xreg=data.frame (log.price) ) 

> boardings.ml1 

detectAO (boardings.m1); detectIO(boardings.m1) 

> boardings.m2=arima(log.boardings,order=c(1,0,3), 
seasonal=list (order=c(1,0,0),period=12), 
xreg=data. frame (log.price, outlier=c(rep(0,31),1,rep(0,36))), 
fixed=c (NA,0,0,rep(NA,5))}} 

> boardings.m2 

> detectAO(boardings.m2); detectIO(boardings.m2) 

> tsdiag (boardings.m2,tol=.15,gof.lag=24) 


W 


O SEWERE. BAF 2003 年 3 月 的 一 场 积 雪 量 达 30 r WAE E ER E ER. HEAR 
中 ， 仍 有 部 分 道路 的 交通 没有 恢复 . 
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最 终 拟 合 模型 诊断 结果 显示 其 与 数据 拟 合 度 很 好 ， 而 且 未 发 现 更 多 的 异常 值 . 对 于 对 数 化 
油价 的 回归 系数 而 言 ， 其 95% 的 置信 区 间 是 (0.0249, 0.139). 注意 对 于 拟 合 模型 的 解释 为 : 
汽油 价格 提高 100%% ， 将 导致 公共 交通 工具 的 使 用 出 现 约 8. 2% 的 增长 . 

另 一 值得 注意 的 有 趣 之 处 是 ， 如 果 在 模型 中 去 掉 异 常 值 项 ， 将 得 出 一 个 新 的 对 数 化 油价 回 
归 系 数 的 估计 值 0.0619， 其 标准 误差 为 0.0372， 因 此 ， 如 果 不 能 对 异常 值 合 理 建 模 ， 则 回归 
系数 很 难 达 到 5% 的 显著 性 水 平 ， 正 如 此 例 所 示 ， 异 常 值 的 存在 会 影响 时 间 序 列 建 模 过 程 中 的 
推断 . 


11.5 小 结 


本 章 使 用 了 得 自 其 他 事件 或 其 他 时 间 序 列 的 信息 来 协助 建立 所 关注 的 时 间 序 列 的 模型 . 
首先 从 所 谓 的 干预 模型 人 手 ， 试 图 将 那些 被 认为 会 对 所 关注 时 间 序 列 有 显著 影响 的 已 知 外 部 
事件 纳入 模型 之 中 . 还 讨论 了 对 这 些 干预 效应 建 模 的 各 种 简单 实用 的 方法 . 随后 研究 了 异常 
值 ， 这 是 一 些 明显 偏离 数据 一 般 变 化 模式 的 观测 值 ， 并 提出 用 于 检测 及 涵盖 时 间 序 列 中 异常 
值 的 模型 .之 后 小 节 中 关于 伪 相 关 的 资料 表明 评估 两 个 时 间 序 列 之 间 的 相关 关系 之 难 ， 但 引 
入 预 白 化 的 有 关 方 法 有 助 于 解决 此 难题 .为 说 明 所 讨论 的 方法 和 技巧 ， 本 章 还 列举 了 和 若干 真 
实 的 案例 ， 


习题 
11.1 使 用 季节 绘图 符号 画 出 1996 年 1 月 至 2005 年 5 月 间 航 空 客运 里 程 数 据 的 时 间 序 列 图 . 
全 屏 显 示 该 图 ， 并 讨论 其 中 的 季节 性 特征 . 详细 数据 见 文件 airmiles. 
11.2 证 明 : 公式 (11. 1.7) Pm, 的 表达 式 满 足 公 式 11.1.6) PAM “ARC” BAB 
式 ， 其 中 初始 条 件 为 m =0. 
11.3 4 8=0.7 时 , RAR 〈11. 1.6) 中 所 确定 的 干预 效应 的 “半衰期 ”. 
11.4 证 明 : 随 着 5 增 大 并 趋 近 于 1， 公 式 (11. 1.6) 中 所 确定 的 干预 效应 的 “半衰期 ”的 增 
长 无 界 . 
11.5 根据 公式 (1.1.6) 中 确定 的 干预 效应 ， 证 明 
TE w(T—t) t>T 
er 10 其 他 
11.6 考虑 图 表 11-3b 中 所 示 的 于 预 效 应 . 
(a) 证 明 : 如 图 所 示 ， 在 T 十 1 时 数值 跳跃 的 高 度 为 w. 
(b) TERA: 如 图 所 示 ， 随 着 t 趋 于 无 穷 大 ,干预 效应 的 大 小 趋 近 于 w/(1— 8). 
11.7 考虑 图 表 11-3c 中 显示 的 干预 效应 .证 明 : 如 图 所 示 ， 自 T 十 1 时 起 ， 于 预 效应 以 w 为 
斜率 线性 增长 . 
11.8 考虑 图 表 11-4a 中 显示 的 干预 效应 . 
(a) 证 明 : 如 图 所 示 ， 在 了 十 1 时 数值 跳跃 的 高 度 为 w. 
(b) 证 明 : 如 图 所 示 ， 随 着 t 趋 于 无 穷 大 ， 干 预 效 应 反而 趋 近 于 0. 
11.9 考虑 图 表 11-4b 中 显示 的 干预 效应 . 
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11. 10 


11. 11 


11.13 
11. 14 


11.15 


11. 16 


11.17 


(a) WEH: 如 图 所 示 ， 在 TT 十 1 NSE H A BE o ta. 
(b) 证明， 如 图 所 示 ， 随 者 上 趋 于 无 穷 大 ， 干 预 效 应 的 大 小 赵 近 于 o. 


考虑 图 表 11-4c 中 显示 的 干预 效应 

(a) WEH: 如 图 所 示 ,， 在 工时 数值 跳 妈 的 高 度 为 wo， 

(b) 证 明 ， 如 图 所 示 ， 在 T 十 1 时 数值 跳 唉 的 高 度 为 由 tar. 

(c) DEA: 如 图 所 示 ， 随 着 上 趋 于 无 穷 大 ， 于 预 效 应 趋 近 于 o. 

根据 公式 11.3.1) 中 的 模型 ， 模 拟 出 100 个 (X, YO 对 ,其 中 d=3, B=0 A 

B=l. Sox=2 有 是 6 二 1]， 通 出 并 说 明 两 序列 间 的 样本 CCF. 

证 明 ， 当 外 和 YY 是 参数 分 别 为 加 AA 的 独立 的 AR(1) 时 间 序 列 时 ， 公式 (11. 3.5) 可 

简化 为 公式 (11. 3. 6). 

WEB: 对 于 公式 (11.4.5) Ae MMR, X MY 之 间 沾 后 为 的 互相 关系 数 为 8-,(o3 /cy ). 

模拟 一 个 $=0.7，y 二 0，o. 三 1 的 长 度 为 ma 一 48 的 AR 时 间 序 列 ， 画 出 时 间 序 列 图 ， 并 

考察 此 序列 的 样本 ACF A PACF. 

(a) 现在 给 模拟 序列 添加 一 个 在 1 二 36 时 具有 单位 高 度 w=1 的 阶梯 函数 响应 .理论 上 
序列 在 t=1 至 35 的 区 间 上 均值 为 零 ， 在 :二 36 之 后 的 均值 为 1. 画 出 新 时 间 序 列 
的 图 ， 并 计算 其 样本 ACF 和 PACF， 比 较 上 述 结果 与 得 自 原始 序列 的 结果 . 

(b) 重复 (a) ， 改 为 添加 一 个 在 :一 36 时 具有 单位 高 度 o=1 的 脉冲 响应 ， 画 出 新 时 间 
序列 的 图 ， 并 计算 其 样本 ACF 和 PACF. 将 以 上 结果 与 原始 序列 的 结果 相 比 较 . 
看 看 读者 能 否 在 不 预知 异常 值 位 置 的 情况 下 ， 检 验 出 在 = 36 时 存在 可 加 异常 值 . 

考虑 本 章 讨 论 过 的 航空 客运 里 程 时 间 序 列 ， 相 应 的 文件 为 airmiles。 本 习题 仅 使 用 预 干 

预 数据 ( 即 2001 年 9 月 之 前 的 数据 ). 

(a) 验证 经 过 取 对 数 和 两 次 差分 处 理 后 的 预 干预 数据 ， 其 样本 ACF 如 图 表 11-15 
所 示 . 

(b (a) 中 所 绘图 表 提 示 了 一 个 ARIMACO, 1, 1) X(0, 1, OLRM. MARR H 
评价 其 适用 性 ， 特别 地 ， 验 证 分 别 存在 于 1996 年 12 月 、1997 年 1 月 及 2002 年 
12 月 时 的 可 加 异常 值 ， 

(ce) 现在 拟 合 带 有 三 个 异常 值 的 ARIMACO, 1, 1) (0，1，0)1: 模 型 并 评价 其 适 
用 性 . 

(dy) 最 后 ， 拟 合 带 三 个 异常 值 的 ARIMA(0，1，1)X (0，1，1)iwzs 模 型 ， 并 评价 其 运 
用 性 . 

使 用 丹佛 地 区 的 对 数 化 公共 交通 工具 载 客 量 和 汽油 价格 序列 ， 数 据 见 文件 boardings. 

(a) 使 用 季节 绘图 符号 画 出 月 载 客 量 的 时 间 序 列 图 ， 并 予以 说 明 . 

Cb) 使 用 季节 绘图 符号 画 出 月 均 汽 油价 格 的 时 间 序 列 图 ， 并 予以 说 明 . 

数据 文件 deerel 中 有 Deere 公司 在 某 特 定 运 营 条 件 下 ， 偏 离 工 业 机 械 加 工 过 程 生 成 的 

特定 目标 值 的 82 个 连续 的 偏差 量 (每 隔 0. 000 025 英寸 为 单位 ) 数据 .习题 6. 33 首次 

使 用 了 这 些 数据 ， 在 那里 可 观测 到 时 间 :一 27 时 一 个 明显 的 异常 值 ， 

(a) 应 用 包括 异常 值 在 内 的 原始 数据 拟 合 AR(2) 模型 . 
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11.18 


11,19 


11. 20 


11. 21 


和 11 # 


(by 对 (a) 部 分 中 的 拟人 台 ARQ) 模型 ， 进 行 AO 检验 和 IO 检验 . 

Cc) 再 拟 合 一 个 增加 了 异常 值 项 的 ARO) 模型 . 

(dO 运用 所 有 已 学 的 模型 诊断 方法 ， 评价 o 中 模型 与 数据 的 拟 合 程度 ， 特 别 地 ， 与 
Ca) 中 模型 比较 一 下 模型 的 性 能 . 

数据 文件 days PALE SCRA AINA RMT Winegard 公司 的 会 计数 据 ， 数 据 为 日 

发 出 130 个 连续 订货 单 直至 Winegard 收 到 某 产品 经 销 商 的 付款 之 间 间 隔 的 天 数 ，( 出 

于 保密 原因 ， 该 经 销 商 不 具名 , ) 习题 6, 39 首先 对 这 些 数据 进行 了 研究 ， 并 观测 到 若 

干 异 常 值 . 当 所 观测 到 的 异常 值 被 更 典型 的 数值 取代 后 ， 可 建立 一 个 MA(2) 模型 . 

(a) 为 原始 数据 拟 合 MA(2) 模型 ， 并 对 其 进行 AO 检验 和 IO 检验 . 

(b) 再 将 异常 值 纳入 模型 中 ， 拟 合 MA(2) 模型. 

(c) 评价 (b) 中 模型 与 数据 的 拟 合 程度 .特别 地 ， 有 没有 出 现 更 多 的 异常 值 ? 

(d) 将 在 lc) 部 分 中 发 现 的 所 有 可 加 异常 值 纳 人 模型 中 ， 拟 合 出 另 一 个 MA(2) 模 
型 ， 并 评价 其 与 数据 的 拟 合 程度 ， 

数据 文件 bluebirdlite 中 包含 的 是 Bluebird 低 盐 型 炸 草 片 的 每 周 销售 量 和 价格 数据 ， 类 

似 于 对 Bluebird 标准 型 炸 暮 片 数 据 所 做 的 处 理 ， 对 这 里 的 数据 作 一 分 析 . 

数据 文件 units 中 包含 的 是 1983 年 至 2005 年 间 ， 一 家 国际 知名 公司 的 某 一 产品 的 年 销 

上 售 量 数据 ，( 出 于 隐私 方面 的 考虑 ， 不 给 出 该 公司 的 真实 和 名称. ) 

(a) 画 出 销售 量 的 时 间 序 列 图 ， 并 描述 此 图 所 具有 的 大 臻 特征. 

(b) 应 用 普通 最 小 二 乘 回 归 ， 为 此 序列 拟 合 一 条 时 间 趋 势 直线 . 

Cc) 天 出 此 模型 的 残 差 样本 PACF ， 并 给 残 差 建立 一 个 ARIMA RH. 

(d) 再 拟 合 如 下 模型 : 销售 量 王 AR(2) 十 时 间 ， 并 解释 输出 结果 ， 特 别 地 ， 将 在 此 得 
到 的 时 间 变 量 回 归 系 数 的 估计 值 与 之 前 在 〈b) 中 所 得 结果 进行 比较 . 

Ce) 对 后 一 模型 的 残 差 进行 全 面 的 分 析 ， 

Cf) 用 对 数 化 的 销售 量 数据 作为 响应 变量 ,重复 Cd) 和 (e)， 并 将 结果 与 (d) 和 
Ce) 中 结果 进行 比较 . 

在 第 5 一 8 章 中 已 经 研究 过 对 数 化 月 油价 序列 的 IMA(1，1) 模型 .图表 8-3 8H, F 

列 可 能 含有 若干 异常 值 ， 用 本 章 所 学 方法 研究 序列 IMA(1，1) 模型 的 异常 值 .一定 

要 将 这 些 结 果 与 之 前 忽略 异常 值 时 所 得 到 的 结果 做 一 比较 . 数据 见 文 件 oil. 


‘ie 
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到 目前 为 止 ， 研 究 的 模型 都 是 关于 时 间 序 列 数据 的 条 件 均 值 结 构 . 然而 ， 由 于 对 金融 数据 
建 模 的 需要 ， 近 期 大 量 的 工作 是 对 时 间 序 列 数 据 的 条 件 方 差 结构 建立 模型 . 令 Y) 为 时 间 序 
列 ， 给 定 Y 过 去 的 值 Y,， ,Y,:,…，, 其 条 件 方差 度量 了 Y, 偏离 条 件 均值 ECY, | Yi ,Y, ; ;… )〉 的 不 
确定 程度 ， 如果 (Y) 满足 某 ARIMA 模型 ， 那 么 对 于 过 程 任何 现在 及 过 去 的 数据 ，( 一 步 向 前 ) 
条 件 方差 总 是 等 于 噪声 方差 . 确实，ARIMA 过 程 任意 给 定 步 长 前 向 预测 的 条 件 方差 为 常数 . 
实际 中 ，( 一 步 向 前 ) 条 件 方差 会 随 着 现在 和 过 去 数值 的 变化 而 变化 ， 因 此 条 件 方差 自身 就 是 
一 个 随机 过 程 ， 通 常 被 称 为 条 件 方差 过 程 . 例如， 经 常 发 现 股票 的 日 收益 率 总 是 在 价格 剧烈 波 
动 期 间 比 在 价格 相对 平稳 的 时 期 具有 更 大 的 条 件 方 差 . 本 章 的 研究 重点 是 对 条 件 方差 过 程 建 
模 ， 基 于 现在 和 过 去 的 数据 ， 通 过 该 模型 可 以 预测 未 来 值 的 波动 .而 前 面 章 市 探讨 的 ARIMA 
模型 关注 的 是 如 何 基于 现在 和 过 去 的 数据 预测 未 来 ， 

在 金融 领域 中 ， 金融 资产 收益 率 的 条 件 方差 通常 作为 对 资产 风险 的 一 一 种 度量 .在 对 金融 资 
产 定价 的 数学 理论 以 及 VaR( 风 险 价值 ) 的 计算 当中 ， 这 是 一 个 重要 组 成 部 分 ， 例 子 见 Tsay 
(2005)， 有 效 市 场 的 预期 收益 率 〈 条 件 均值 ) 应 该 为 零 ， 因 而 收益 率 序 列 应 为 白 噪声 序列 ， 这 
种 序列 具有 最 简单 的 自 相关 结构 . 因此， 为 表达 方便 ， 本 章 的 前 几 节 均 假 设 数 据 指 的 是 某 些 金 
融资 产 的 收益 率 ， 且 是 白 噪声 ， 即 序列 无 关 的 数据 .如 是 处 理 ， 妓 可 从 一 开始 就 集中 精力 研究 
如 何 为 时 间 序 列 的 条 件 方差 结构 建 模 . 本 章 最 后 将 通过 把 ARIMA 模型 和 条 件 异 方差 模型 结合 
在 一 起 ， 来 讨论 同时 为 条 件 均值 和 条 件 方差 结构 建 模 的 若干 简化 方案 . 


12. 1 金融 时 间 序 列 的 一 些 共 同 特征 


作为 一 个 金融 时 间 序 列 的 例子 ， 我 们 考察 从 2004 年 8 月 26 日 至 2006 年 8 月 15 日 这 段 时 
期 内 一 单位 CREF 股票 基金 的 每 日 价值 的 变化 .CREF 股票 基金 是 由 数 千 只 股票 组 合成 的 ， 并 
上 且 不 能 在 股票 市 场 上 公开 交易 9. 因为 股票 在 周末 和 节假日 不 交易 ， 只 能 在 所 谓 的 交易 日 交 
易 ， 所 以 CREF 的 数据 在 周末 和 节假日 期 间 是 不 会 变化 的 .为 了 简单 起 见 ， 我 们 假设 数据 时 间 
间隔 是 相等 的 ， 图 表 12-1 展示 了 CREF 数据 的 时 间 序 列 图 .数据 呈现 出 总 体 上 升 的 趋势 ， 并 
上 且 具有 随 着 股价 增加 波动 幅度 更 大 的 迹象 . 令 { 如 表示 时 间 序 列 ， 警 如 某 金 融资 产 的 日 价 
格 ， 第 上 天 的 〈 连 续 复 利 的 ) 收益 率 定 义 为 

= log( p,) — log(p,-1) nee Ul, Ve 
有 时 候 ， 收 益 率 会 乘 以 100， 以 表示 为 价格 变动 的 百分比 形式 . 因为 原始 的 收益 率 是 一 个 很 小 
的 数字 ， 在 计算 中 存在 着 大 量 的 含 人 误差 ， 所 以 这 种 乘 以 100 的 处 理 可 以 减少 数值 误差 . 

图 表 12-2 描绘 了 CREF 收益 率 的 时 间 序 列 〈 样 本 容量 = 王 500). 该 图 显示 出 收益 率 在 一 些 
时 期 波动 更 大 ， lea be ot ~ 
方 值 的 时 间 序 列 图 中 更 为 明显 ， 见 习题 12. 1. 


© CREF 是 大 学 退休 权益 基金 的 缩写 ， 这 是 对 许多 大 学 教师 退休 计划 很 重要 的 一 组 股票 和 债券 基金 的 组 合 . 


图 表 12-1 A CREF 股票 价值 : 2004 年 8 月 26 日 至 2006 年 8 月 15 日 


CREF 


0 100 200 300 400 
时 间 


> win.graph (width=4.875,height=2.5,pointsize=8) 
> data(CREF); plot (CREF) 


这 些 结 果 可 能 是 中 东 地 区 的 不 稳定 局 面 引发 的 ， 因 为 黎巴嫩 南部 自 2006 年 7 月 12 日 至 8 月 14 
日 战事 不 断 ， 在 图 表 12-1 和 图 表 12-2 中 这 段 时 期 用 灰色 阴影 表示 . 这 种 大 量 的 持续 的 平静 和 
波动 相交 替 的 模式 在 文献 中 被 称 为 波动 集群 ， 时 间 序 列 的 波动 性 意味 着 时 间 序 列 的 条 件 方差 随 
着 时 间 的 变动 而 变动 . 时 间 序 列 的 动态 波动 模式 〈 换 言 之 ， 时 间 序 列 的 条 件 方 差 过 程 ) 是 本 章 
的 主题 . 


图 表 12-2 CREF 股票 日 收益 率 : 2004 年 8 月 26 日 ~2006 年 8 月 15 日 


2 ee 
说 出 | Te mil 4 | | i 
= o MAn ALD a Wu i WE A t aA a TLLA A da 
EF i mu | [机 i eee i | WEE Eii i Vid bd gS 
= O AAA E TAAL P 
a Bilis he 下 | 
5 —] | | Pe 
=) i : | teens 
0 100 200 300 400 500 
时 间 


SA 
> r.cref=diff(log(CREF))*100 
> plot(r.cref); abline (h=0) 


如 图 表 12-3 和 图 表 12-4 fim., CREF 的 日 收益 率 〈 乘 以 了 100 的 ) 的 样本 ACF A PACF 显 
示 收 益 率 基本 不 存在 序列 相关 性 ， 样 本 EACF( 图 中 没有 显示 出 来 ) 也 说 明了 对 该 数据 来 讲 白 噪声 
模型 是 适当 的 ，CREF 收益 率 均值 等 于 0. 0493， 标 准 差 等 于 0.028 85. 因此 ， 收 益 率 过 程 的 均值 
并 没有 显著 地 不 同 于 零 . 基于 本 章 序言 提 及 的 市 场 有 效 性 假设 ， 这 一 结果 是 可 以 预期 的 ， 

然而 ， 在 CREF 收益 率 数 据 中 所 观测 到 的 波动 集群 现象 给 了 我 们 一 个 启示 ， 即 收益 率 的 分 
布 不 是 独立 同 分 布 的 ， 否 则 随 着 时 间 的 变化 方差 应 该 是 一 个 常数 ， 这 是 我 们 研究 时 间 序 列 模型 
中 首次 需要 区 分 序列 值 的 不 相关 性 和 序列 值 的 独立 性 如果 序 列 值 真 的 是 相互 独立 的 ， 那 么 瞬 
时 的 非 线性 变换 后 ， 如 求 对 数 、 绝 对 值 、 平 方 ， 仍 然 保留 独立 性 ， 但 是 ， 对 相关 性 来 说 并 非 如 
此 ， 因 为 相关 性 仅仅 是 对 线性 相关 程度 的 度量 .通过 研究 收益 率 的 绝对 值 〈 样 本 变动 较 小 ， 但 
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是 数学 上 不 易 处 理 ) 或 者 平方 值 〈 样 本 变动 较 大 ， 但 是 在 统计 理论 上 便于 操作 ) 的 自 相关 结 
构 ， 可 以 发 现 数 据 的 高 阶 序列 相关 结构 ， 如 果 收 益 率 是 独立 同 分 布 的 ， 那么 收益 率 的 绝对 值 
(平方 值 同 样 ) 也 是 独立 同 分 布 的 ， 因 此 也 都 是 白 噪 声 过 程 . 如 果 收 益 率 的 绝对 值 或 者 平方 值 
表现 出 明显 的 上 自 相关 性 ， 那 么 这 种 自 相关 性 就 有 力 地 驶 斥 了 收益 率 是 独立 同 分 布 的 假设 ， 事 实 
上 ， 图 表 12-5 到 图 表 12-8 中 收益 率 绝对 值 和 平方 值 的 样本 ACF 和 PACF 明显 地 表现 出 了 自 
相关 性 ， 因 此 为 证 实 CREF 日 收益 率 并 非 独 立 同 分 布 提供 了 有 力 的 证 据 . 

图 表 12-3 CREF 日 收益 率 的 样本 ACF: 2004 年 8 月 26 日 ~2006 年 8 月 15 日 


> acf (lr.cref) 


BR 12-4 CREF 日 收益 率 的 样本 PACF: 2004 年 8 月 26 日 一 2006 年 8 月 15 日 


> pac (r.cretf) 


> acf (aba (r.cref)) 


图 表 12-6 CREF 日 收益 率 绝 对 值 的 样本 PACF 


0 5 10 15 20 25 


> pacf (abs (r.cref) ) 


图 表 12-7 CREF 日 收益 率 平 方 的 样本 ACF 


-= ae BS i iil 


> acf (r.cref*2) 
cect la al, a 


图 表 12-8 CREF 日 收益 率 平方 的 样本 PACF 


> pacf (r.cref*2) 
> 上 vv ”~ 一 0 


这 些 视图 工具 经 常 辅 之 以 Box-Liung 检验 来 正式 地 判断 平方 值 数据 是 否 具 有 自 相 关 性 ， 因 
为 不 需要 拟 合 模型 ，Box-Ljung 检验 的 近似 卡 方 分 布 的 自由 度 等 于 在 检验 中 所 使 用 的 相关 系数 
的 个 数 ， 因 此 ， 如 果 在 检验 中 我 们 使 用 平方 数据 的 m 个 自 相 关系 数 ， 不 存在 ARCH 时 ， 检 验 
统计 量 近似 服从 m 个 自由 度 的 卡 方 分 布 ， 此 方法 可 以 扩展 到 条 件 均 值 非 零 并 且 用 一 个 ARMA 
模型 能 充分 地 描述 数据 的 自 相 关 结 构 的 过 程 . 这 种 情况 下 ， 该 模型 的 残 差 的 平方 的 前 m TA 
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相关 系数 可 以 用 来 检验 ARCH 的 存在 性 .在 没有 ARCH 效应 的 假设 下 ， 相 应 的 Box-Liung 统 
计量 服从 m 个 自由 度 的 卡 方 分 布 ， 见 McLeod 和 Li(1983) 以 及 Li(2004). KWE, RKB 
差 或 者 数据 平方 构造 的 Box-Ljung 统计 量 来 判断 ARCH 效应 的 检验 为 McLeod-Li 检验 . 

实际 中 ， 使 用 McLeod-Li 检验 时 ， 用 一 系列 河 后 并 且 描 绘 出 检验 的 p 值 来 检验 ARCH 效应 
非常 有 效 ， 图 表 12-9 显示 当 滞 后 大 于 3 时 ，McLeod-Li 检验 在 5% 的 显著 水 平 上 都 显著 ， 这 一 点 
和 图 表 12-? 中 的 直观 模式 是 非常 一 致 的 ， 并 且 给 数据 具有 ARCH 特征 提供 了 强 有 力 的 证 据 . 


图 表 12-9 CREF 日 收益 率 McLeod-Li 检验 统计 慎 


a 
me en T. ee nn E E E E ee ee ee ee ee ee 
0.04 — 9 站 


0 5 10 15 20 25 
He 
> win.graph(width=4.875, height=3,pointsize=8) 
> McLeod.Li.test (y=r.cref) 


CREF Hik 38 HY) 4 HAR GT A ee ABET EAS KA QQ 图 来 体现 一 一 如 图 表 12-10 所 
AN. QQ 图 显示 收益 率 的 分 布 比 正 态 分 布 的 图 表 12-10 CREF 日 收益 率 的 正 态 QQ 图 
尾部 要 偶 厚 一 些 ， 并 有 些 向 右 偏 斜 ， 确实， 
检验 正 态 性 Shapiro-Wilk 统计 量 等 于 
0.9932， 力 值 等 于 0.024， 因 此 在 通常 的 显 
善 水 平 上 拒绝 正 态 性 假设 , 

随机 变量 Y 的 偏 度 被 定义 为 EY 2° / 
d, EP u Aona Y 的 均值 和 标准 差 . 


随机 变量 的 偏 度 可 以 由 样本 偏 度 来 估计 : -2 ne i ae 
g= > OY lige OLLO 理论 分 位 数 


> win.graph(width=2.5 ,height=2.5,pointsize=8) 
> qqnorm(r.cref); qqline(r.cref) 


其 中 # = DC, Y/n 是 样本 方差 、CREF 
收益 率 的 样本 偏 度 等 于 0. 116. 分布 相 对 于 
正 态 分 布 的 尾部 厚度 通常 是 由 (超额 的 ) 峰 度 来 衡量 的 ， 定 义 为 EY- 一 3， 对 于 正 态 
分 布 来 讲 ， 其 峰 度 总 是 为 零 ， 一 个 正 峰 度 的 分 布 被 称 为 厚 尾 分 布 ， 一 个 负 峰 度 的 分 布 被 称 为 薄 
尾 分 布 。 峰 度 可 以 由 样本 峰 度 来 估计 : 


g: 一 X,Y; — Y) / (ng) 3 CED 3) 
im] 
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CREF 收益 率 的 样本 峰 度 等 于 0.6274. 峰 上 度 的 另 一 个 定义 式 是 将 原 公 式 修改 为 Elr, 一 
w/o; 换言之， 在 比例 中 没有 减 去 3， 我 们 始终 使 用 峰 度 的 第 一 个 定义 . 

另 一 个 正 态 性 检验 是 Jarque-Bera 检验 ， 这 一 检验 是 基于 正 态 分 布 是 零 偏 度 和 零 峰 度 的 事 
实 . 假设 Y1 Yoo. Y, 是 一 组 独立 同 分 布 的 数据 ， 则 Jarque-Bera 检验 定义 为 


2 2 
— MEL TLE 2 
JB = E Toy (12. 1. 4) 


其 中 g HRA. 2 为 样本 峰 度 ， 在 正 态 性 的 零 假 设 条 件 下 ，Jarque-Bera 检验 的 统计 数据 
分 布 近似 服从 2 个 自由 度 的 y 分布， 事实 上 ， 在 正 态 性 的 假设 下 ，Jarque-Bera 统计 量 定义 中 
的 每 个 被 加 数 近 似 服从 1 个 自由 度 的 x 分布， 如果 统 计量 的 值 太 大 的 话 ，Jarque-Bera 检验 拒 
“a TE ASHE. CREF 收益 率 的 J B=500 X 0. 1167/64-500 X0. 6274°/24=1. 12 十 8. 20=9. 32, 
户 值 为 0.011， 忆 及 单 自 由 度 y 分 布 的 上 部 5% 临 界 值 是 3. 84， 因 此 数据 看 似 设 有 偏 斜 ， 但 的 
确 具 有 一 个 相对 厚 的 尾部 ， 特别 地 ， 正 态 性 假设 是 不 符合 CREF 收益 率 数 据 的 一 一 这 个 结论 与 
Shapiro-Wilk 检验 的 结果 相 同 . 

M>, CREF 收益 率 数据 是 序列 不 相关 的 ， 但 存在 高 阶 相关 结构 ( 即 波 动 集群 ) 和 厚 尾 分 
布 ， 金 融 时 间 序 列 数据 中 这 些 特征 是 十 分 普 浪 的 ， 下 一 节 我 们 将 介绍 GARCH 模型 ， 它 为 具 
有 以 上 特征 的 时 间 序 列 数据 建 模 和 分 析 提 供 了 一 个 框 染 . 


12.2 ARCH(1) 模 型 


Engle(1982) 第 一 次 提出 针对 时 间 序 列 变 化 的 方差 的 自 回归 条 件 异 方差 模型 “ARCH). 
如 前 所 述 ， 一 项 金融 资产 的 收益 率 数据 (例如 nD 通常 是 零 均值 序列 无 关 的 过 程 ， 即 便 是 
在 其 展现 出 波动 集群 性 时 亦 然 ， 这 意味 着 给 定 过 去 的 收益 率 时 x, 的 条 件 方 差 并 非常 数 . 7, 的 
条 件 方差 也 称 为 条 件 波动 率 ， 用 ,| 表示 ， 下 标 1 一 1 表示 以 1 一 1 时 刻 前 的 收益 率 为 条 件 。， 当 
r 可 得 时 ， 收 益 率 的 平方 7? 为 a? ,1 的 一 个 无 偏 估计 量 ， 收 益 率 的 平方 值 比较 大 的 序列 可 以 预 
测 一 段 相对 波动 的 时 期 ， 反 之 ， 收 益 率 平方 值 较 小 的 序列 可 以 预测 一 段 相 对 平静 的 时 期 . 
ARCH 模型 在 形式 上 是 一 个 回归 模型 ， 其 条 件 波动 率 是 因 变 量 ， 往 期 收益 率 平 方 值 是 协 变 量 . 
例如 ，ARCH(1) 模型 假设 收益 率 序列 fr.) 由 下 式 生成 : 
Fy, = Oar (12. 2. 1) 
dai = w Hare (122:2) 
其 中 ，a 和 w 是 未 知 参数 ，{e',} 是 具有 零 均值 和 单位 方差 的 独立 同 分 布 随机 变量 的 序列 〈 也 称 
wee). He 与 r 一 是 相互 独立 的 ,7 一 1,2,… He 被 假定 为 具有 单位 方差 ， 困 此 r 的 
条 件 方差 等 于 oil ， :此 结论 可 以 从 下 面 的 式 子 中 得 到 
Er? | rep] = 152.08) = Elime: Pr 可 二 12 = f Ete? |r = 1,259) 
= gi Elei) = die 有 下 
第 二 个 等 式 成 立 是 由 于 给 定 过 去 的 收益 率 时 cl,-: 已 知 ， 第 三 个 式 子 成 立 是 因为 e 与 过 去 的 收 
益 率 相 互 独立 ， 最 后 一 个 等 式 成 立 是 由 于 假设 e 的 方差 等 于 1. 
图 表 12-11 展示 了 一 个 样本 容量 为 500 的 用 ARCH(1) 模型 模拟 的 时 间 序 列 图 形 ， 其 中 
w=0.01, a 二 0, 9， 虽 然 由 于 条 件 方 差 过 程 记忆 短 ， 数 据 能 够 从 大 的 波动 中 很 快 地 恢复 ， 但 是 
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较 大 的 波动 聚集 在 一 起 ， 数 据 的 波动 集群 性 非常 明显 .5 
图 表 12-11 模拟 的 ARCH(1) 模型 ，w=0.01 且 a, =0.9 


> set .seed(1235678) ; library (tseries) 
> garch0Ol.sim=garch.sim(alpha=c(.01,.9),n=500) 
> plot (garch0l.sim,type='1',ylab=expression(r[t]), xlab='t') 


虽然 ARCH 模型 类 似 一 个 回归 模型 ， 但 其 条 件 方差 不 是 直接 观测 到 的 (也 因此 被 称 作 潜 在 
变量 )， 导 致 了 在 使 用 ARCH 模型 对 数据 进行 分 析 时 有 细微 差别 ， 例如， 如何 通 过 图 形 来 表示 回 
归 关 系 并 不 是 很 显然 的 .为 了 画图 ， 需 要 用 一 些 观测 值 来 代替 方程 (12. 2.2) 中 的 条 件 方差 . 令 

Me = ri — One (12.3.4) 
可 以 证 实 ，{m) 是 均值 为 零 的 不 相关 序列 ， 并 且 nn 与 过 去 的 收益 率 不 相关 ， 将 oni Sri 
代 人 到 方程 (12.2.2). BRA 
ri =wtariitn (12. 2. 5) 
因此 ， 在 收益 率 序 列 满足 ARCH(1) 模型 的 假设 下 ， 收 益 率 平方 序列 满足 ARC) 模型 ， 基 于 
这 个 有 用 的 结论 ， 如 果 用 前 几 章 学 到 的 技术 可 以 设 定 收 益 率 的 平方 满足 AR(1) 模型 ， 那 么 收 
益 率 就 可 设 定 为 ARCH(1) MMT. 

除了 在 数据 分 析 中 具有 价值 以 外 ， 推 导出 的 收益 率 平方 的 AR(1》 模型 可 用 以 得 出 ARC 晶 
模型 参数 化 的 理论 洞 见 ， 例如， 由 于 收益 率 的 平方 一 定 是 非 负 的 ， 那 么 总 是 限制 参数 w 和 a 非 
负 是 很 有 意义 的 ， 同 样 ， 如 果 收 益 率 数列 是 平稳 的 ， 方 差 是 于， 那么 可 以 对 方程 〈12. 2.5) 两 
边 求 期 望 得 到 

oe = w+ ao’ (12. 2. 6) 
BD ot=w/Q—-a), XHA 0La<1. SKE, AUAI O<e<1 是 ARCH(1) 模型 〈 弱 ) 平稳 的 
充分 必要 条 件 (Ling 和 McAleer, 2002). 一 见 之 下 ， 平 稳 概念 与 条 件 异 方差 概念 似乎 是 不 相 
容 的 ， 然 而 ， 记 得 弱 平稳 过 程 要求 序 列 的 均值 为 常数 ， 且 不 管 两 个 时 期 的 滞后 是 否 一 样 ， 有 限 
相等 的 时 间 间 隔 上 的 协 方差 是 常数 .特别 地 ， 弱 平稳 过 程 的 方差 是 常数 ， 条 件 0 三 a 二 1 意味 着 
r。 具 有 初始 分 布 ， 使 得 由 方程 (12. 2. 1) 和 方程 (12. 2. 2〉 定 义 的 xr,(t 宇 1) 是 上 述 意义 上 的 
弱 平 稳 过 程 ， 有趣 的 是 ， 弱 平稳 性 不 能 排除 条 件 方 益 过 程 非常 数 的 可 能 性 ，ARCH(1) RAS 
是 这 种 情况 ， 可 以 证 实 ARCH(1) 过 程 是 白 噪 声 ， 因 此 它 是 这 样 的 一 个 白 噪声 过 程 : 该 过 程 的 


日 、 本 章 需 要 名 为 tseries 的 R 程序 包 ， 假设 读者 已 经 下 载 并 安装 了 该 程序 包 . 


由 方程 (12.2.2) 定义 的 条 件 方差 过 程 不 是 常数 ， 它 随 着 平方 后 过 程 的 一 阶 滞后 的 变化 而 
变化 . | 
ARCH(1) 模型 的 一 个 令 人 满意 的 特征 是 ， 即 使 新 息 n 是 正 态 分 布 ,， 在 1>>0 的 条 件 
下 ，ARCH(1) 模型 的 平稳 分 布 也 是 厚 尾 分 布 ; 换言之 ， 其 峰 度 Elr; )/o' 一 3 KFS. (回顾 
正 态 分 布 的 峰 度 总 是 等 于 零 ， 一 个 峰 度 为 正 的 分 布 被 认为 是 厚 尾 分 布 ， 而 一 个 峰 度 为 负 的 分 布 
被 认为 是 薄 尾 分 布 . 〉 为 了 证 明 这 个 结论 的 正确 性 ， 考 虑 (e) 是 独立 同 分 布 和 标准 正 态 分 布 
的 情况 . 对 方程 (12. 2. 1) 两 边 4 次 方 后 ， 求 取 期 望 有 
Elri) = ELE(al et | rj = 1425350) ] = Elon Ee | rsj = 1,2,3,")] 
= E[oi,.Ete!) ] = 3E(oh, ) C13 2.9) 
第 一 个 等 式 得 自 迭 代 - 期 望 公式 . 在 只 有 两 个 随机 变量 X, Y 的 简单 情况 下 ， 这 一 原则 表述 为 
EFTE(X | Y)] 王 ECX)，[ 可 以 参阅 公式 (9. E. 5)] 第 二 个 等 式 来 源 于 给 定 过 去 的 收益 率 序 列 
o | ,是 已 知 的 ， 第 三 个 等 式 是 s 与 过 去 的 收益 率 之 间 相 互 独立 的 结果 .最 后 一 个 等 式 来 目 正 
态 性 假设 ， 只 剩 下 计算 Ei)... 现在， 并 不 知道 前 面 这 个 期 望 是 否 作为 一 个 有 限 数 字 存 在 . 
目前 先 假设 它 确实 存在 ， 并 且 假 设 平稳 ， 用 r 表示 . 下 面 ， 我 们 将 推导 使 本 假设 成 立 的 条 件 . 
将 方程 (12.2.2) 两 边 平 方 并 且 求 期 望 得 到 


r= w +2wa0’ +a’3r (12. 2. 8) 
此 式 意味 着 
ow + 2w0a0" 
=e (12. 2.9) 


这 一 等 式 给 出 了 r 有 限 的 必要 条 件 (事实 上 ， 也 是 充分 条 件 ) 是 0 全 a 二 1/Y3， 在 此 条 件 下 
ARCH(1) 过 程 具有 有 限 的 四 阶 矩 .附带 地 这 说 明 一 个 平稳 的 ARCH(1) 模型 不 一 定 具有 有 
限 的 四 阶 矩 .有限 的 高 阶 矩 的 存在 性 会 进一步 限制 参数 的 范围 一 一 类 似 的 高 阶 的 ARCH 模型 
和 它 的 变形 都 有 这 样 一 个 特征 ， 回 到 对 ARCH(1) 过 程 峰 度 的 计算 中 来 ， 通 过 繁琐 的 代数 变 
换 ， 方 程 (12. 2. 1) 蕴涵 着 r>, Ali Ei) >36. AFR ARCH(1) 过 程 的 峰 度 大 于 
零 ， 这 证 实 了 我 们 早 前 的 结论 : 一 个 ARCHO) 过 程 即 使 有 正 态 新 息 也 是 厚 属 分布 、 换言之 ， 
厚 尾 是 由 方程 (12. 2. 2) 设 定 的 波动 集群 的 结果 . 
ARCH 模型 的 一 个 主要 用 途 是 预测 未 来 的 条 件 方差 . 例如 ， 有 人 可 能 对 预测 有 步 向 前 条 
dima = Elri | terre) (12. 2. 10) 
对 于 A 二 1，ARCH(1) 模型 蕴涵 着 
dine = w tari = (1 —a)o +ar; 全 >) 
这 是 长 期 方差 与 即 期 收益 率 平方 的 加 权 平 均 ， 类似 地 ， 使 用 迭代 -期 望 公式 ， 可 以 得 出 
Oras = Eri, | reste) = ELE Cottniern-1 eth Retr ith Raa reer | 
= Eloa Eleta) | terest = Eloa | ror i (12. 2. 12) 
= w tak Cri | Fr tD) = w + airs lle 
fe A<O0 的 情况 下 ,我 们 约定 cwi, 一 ms。、 上 述 公式 给 出 了 一 个 计算 疡 步 向 前 条 件 方差 的 递归 
方法 . 
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12.3 GARCH 模型 


鉴于 对 未 来 条 件 方 差 的 预测 仅 涉及 最 近 的 收益 率 平 方 值 ， 因 此 上 节 推 导出 来 的 预测 公式 尽 
显 了 ARCHO) 模型 的 优 劣 所 在 .实践 中 ， 人 们 可 能 会 希望 使 用 所 有 过 去 的 收益 率 平方 值 
( 越 往 前 的 数据 权重 越 低 ) 来 提高 预测 的 精确 度 . 一 种 方法 是 在 模型 中 增加 更 多 的 收益 率 平 方 
的 滞后 项 ，Engle(1982) 提出 的 ARCH(q) 模型 对 方程 (12. 2. 2) 进行 了 推广 ， 设 为 

dm = wtar Hari: + tari (12. 3. 1) 
XE, 指 的 是 ARCH 的 阶 数 . 另 一 个 方法 是 由 Bollerslev(1986) 和 Taylor(1986) 提出 的 ，. 
模型 中 包括 条 件 方差 的 p 阶 灌 后 ， 其 中 p 表示 GARCH 的 阶 数 . 该 混合 模型 被 称 为 广义 自 回 
归 条 件 异 方差 模型 GARCH(p，9g). 
dim = wt Prorrjee Hoe + Bor pe pi tarn Har +o tare, (12. 3.2) 
用 延迟 算 子 B， 模 型 可 以 表达 为 
(1 一 及 如 一 …… 一 BB2)oi = wt la B+ t+aB’)r (12. 3. 3) 

注意 ， 在 若干 文献 中 记号 GARCH(p, q) 也 写作 GARCH(g，p)， 即 阶 数 交 换 了 顺序 . 
这 两 种 不 同 的 习惯 用 法 在 不 同 的 软件 中 均 有 使 用 ， 这 给 我 们 带 来 了 很 大 的 困扰 ， 读者 在 使 用 软 
件 拟 合 和 解释 GARCH 模型 前 ， 必 须 搞 清楚 软件 中 使 用 的 是 哪 一 种 习惯 表示 法 . 

因为 条 件 方差 必须 是 非 负 的 ， 所 以 在 GARCH 模型 中 系数 必须 限定 为 非 负 的 . 然而 ， 参 
数 非 负 的 约束 并 不 是 GARCH 模型 的 条 件 方差 以 概率 1 非 负 的 必要 条 件 ， 可 以 参考 Nelson 和 
Cao(1992) 以 及 Tsai 和 Chan(2006). 人 允许 参数 取 值 为 负 或 可 增加 借助 GARCH 模型 所 能 捕捉 
到 的 动态 模式 .后面 还 将 探讨 这 一 问题 . 本 节 后 续 部 分 内 容 均 假设 GARCH 参数 满足 非 负 这 
一 约束 条 件 . 

图 表 12-12 展示 了 一 个 样本 容量 为 500 的 时 间 序 列 的 图 形 . 该 序列 用 具有 标准 正 态 新 息 、 
BAH w=0.02, a=0. 05 和 8=0.9 的 GARCH(1，1) 模型 模拟 得 到 .图形 具有 显著 的 波动 
集群 性 ， 大 幅 (小 幅 ) 波动 后 面 通常 跟着 一 个 大 幅 的 〈 小 幅 的 ) 波动 . 此 外 ， 因 为 模型 中 包含 
条 件 方差 的 1 阶 滞后 ， 因 此 成 功 地 提高 了 波动 率 的 记忆 性 . 


图 表 12-12 模拟 的 GARCH(1, 1) 过 程 


> Set.seed(1234567) 
> garchll.sim=garch.sim(alpha=c(0.02,0.05) ,beta=.9,n=500) 
> plot (garchll.sim,type='1',ylab=expression(r{t]), xlab='t') 


除了 在 3 阶 滞后 和 20 阶 滞 后 处 表现 出 微弱 的 显著 性 ， 图 表 12-13 和 12-14 中 的 模拟 数据 的 
样本 ACF 和 PACF 没有 显示 出 显著 的 相关 性 . 因此 ， 模 拟 的 过 程 看 起 来 基本 上 是 序列 无 关 的 ， 
事实 上 确实 如 此 . 


图 表 12-13 ”模拟 和 的 GARCH(1, 1) 过 程 的 样本 ACF 


> acf (garchil.sim) 


图 表 12-14 模拟 的 GARCH(1, 1) 过 程 的 样本 PACF 


> pacf (garchil.sim) 


图 表 12-15 至 12-18 给 出 了 模拟 数据 的 绝对 值 和 平方 值 的 样本 ACF H PACF. 
图 表 12-15 ”模拟 的 GARCH(1, 1) 过 程 的 绝对 值 的 样本 ACF 


ACF 


> acf (abs (garchll.sim) ) 
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图 表 12-16 模拟 的 GARCH(1, 1) 过 程 的 绝对 值 的 样本 PACF 


> pacf (abs (garch11.sim)) 


这 些 图 形 显示 绝对 值 和 平方 数据 存在 显著 的 自 相 关 模 式 ， 说 明 模 拟 过 程 实际 上 是 序列 相关 
的 . 有 趣 的 是 ， 在 最 后 四 个 图 形 中 1 阶 滞后 自 相关 系数 都 不 显著 . 


图 表 12-17 模拟 的 GARCH(1, 1) 过 程 的 平方 值 的 样本 ACF 


> acf (garchli.sim*2) 


图 表 12-18 ”模拟 的 GARCH(1, 1) 过 程 的 平方 值 的 样本 PACF 
0.15 


> pacf (garchLL.sim 2) 


为 了 识别 GARCH 的 阶 数 ， 同 样 地 ， 用 收益 率 平方 的 形式 来 表示 条 件 方差 模型 仍 会 比较 
方便 ， 回 想 定 义 n= 二 ?一 ?1, 1， 类 似 于 ARCH) 模型 ， 可 以 证 明 {%》 是 序列 无 关 的 过 程 . 
此 外 ， 与 过 去 的 收益 率 平方 是 不 相关 的 . 将 表达 式 of) 1 Sri p 带 入 方程 (12. 3. 2) 得 到 
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= w+ (Bı 十 al ri t'et ( Brmaxt psa) aa eee P 十 nr — fi M-i 一 — Prhe 

(12. 3. 4) 
EP, OTMABRMk>pAB=0, MF ROG, Aa =0. 该 式 表 明 收 益 率 序列 的 GARCH 
Cp» q) 模型 蕴涵 着 收益 率 平方 满足 ARMACmax(p, q), p) 模型 因此， 可 将 ARMA 模型 
的 识别 技巧 用 于 收益 率 平方 序列 ， 来 确定 p 和 max(p，gq). 需要 注意 ， 如 果 g 比 p 小 ， 在 模型 
识别 中 将 被 掩盖 而 无 法 识别 ， 在 这 种 情况 下 ， 可 先 拟 合 GARCH(p，p) 模型 ， 然 后 对 所 得 的 
ARCH 系数 估计 量 进行 显著 性 检验 ， 从 而 估计 q. 

以 图 表 12-19 为 例 ， 给 出 模拟 GARCH(1，1) 序列 取 值 的 平方 的 样本 EACF. 


图 表 12-19 ”模拟 的 GARCH(1, 1) 序列 取 值 的 平方 的 样本 EACF 


AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 
0 o o x x o o x o o 0 o o o 0 
1 x o o o x o x x o o 0 o o o 
2 x o o 0 o o x o o o o o o o 
3 x x x OO o x o o o 0 o o o o 
4 x x o x x o o o o o 0 o o 0 
5 x o x x o o a o o o o o o 9 
6 x o x x o x o 0 o o o o o o 
7 x x x x x x o o o o o o o o 


> eacf ((garch11.sim)^2) 


虽然 ARMA(2，2) 模型 似 较 恰当 ， 但 是 EACF 表 中 的 模式 并 不 很 明晰 . EACF 表 中 信号 
的 模糊 性 可 能 是 在 处 理 较 高 阶 矩 时 样本 变动 较 大 的 结果 .Shin 和 Kang(2001) 认为 ， 对 于 一 
MEE, FRAPPR TET ICH KM. MRA TORR ARMA 过 程 的 阶 数 . 他 们 的 研究 结 
论说 明 ， 或 可 通过 研究 绝对 收益 率 来 识别 GARCH 的 阶 数 . 确实 ， 图 表 12-20 所 示 的 收益 率 绝 
对 值 的 样本 EACF 表 显 示 用 ARMA(1，1) 模型 更 令 人 信服 ， 从 而 对 于 原始 数据 识别 为 
GARCH(1, 1) Ba, 尽管 也 显示 出 GARCH(2，2) 模型 的 迹象 . 


图 表 12-20 ”模拟 的 GARCH(1, 1) 序列 的 绝对 值 的 样本 EACF 
2 4 5 7 10 
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> eacf (abs (garch11.sim) ) 


对 于 CREF 日 收益 率 绝对 值 ， 其 样本 EACF 见 图 表 12-21， 该 表 建 议 设 定 GARCH(1, 1) 
模型 ， 但 是 CREF 收益 率 平方 值 相应 的 样本 EACF (未 显示 ) 并 不 那么 清晰 ， 可 能 会 导致 
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GARCH(2, 2) 模型 的 设 定 . 
图 表 12-21 CREF 日 收益 率 绝对 值 的 样本 EACF 


AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 
0 o D O o o o o o o x x o o o 
l x o o a o Q o o o o 0 o o o 
2 x 0 0 o o o o o o o 0 o o o 
3 x o x o o o o o o o fe) 0 o o 
4 x o x o o 0 0 o o 0 o o 0 o 
5 x x x x o o o o o o 0 o 0 o 
6 x x x x o O D o o o o o o o 
7 x x x x o 0 o o o 0 o o o o 


> eacf (abs(r.cref) ) 


另外 ， 对 绝对 值 数据 拟 合 的 ARMA 模型 的 参数 的 估计 ， 可 以 作为 对 GARCH 模型 用 极 大 
似 然 估计 法 估计 的 初 值 例如， 图 表 12-22 报 图 表 12-22 ”模拟 GARCH(1，1) 序列 绝对 值 的 
告 了 对 模拟 的 GARCH(1, 1) 过 程 的 绝对 值 ARMA(1, 1) 模型 之 参数 估计 
拟 合 的 ARMA(1，1) 模型 的 参数 的 估计 . 系 数 arl mal R E 

根据 方程 (2.3.4), 可 以 知道 8 的 估计 值 估计 0. 9821 一 0. 9445 0. 5077 
J 0. 9445, a 的 估计 值 为 0.9821 — 0.9445 = Spa eR eT EP eT a ETE 
0.0376, o 可 以 用 原始 数据 的 方差 乘 以 1 一 a 一 8 > 于 -了 AT O 
的 估计 值 来 估计 ， 等 于 0. 0073. 邻 人 惊奇 的 是 ， 这 些 估计 值 与 下 一 节 报 告 的 极 大 似 然 估 计 值 
非常 接近 . 

我 们 现在 推导 GARCH 模型 弱 平稳 的 条 件 . 假设 收益 率 过 程 是 弱 平 稳 的 . 对 方程 
(12.3.4) 两 边 取 期 望 可 以 得 到 无 条 件 方差 o 的 计算 公式 : 


max( p,q) 


e=wto >) (Bta) (12. 3.5) 
i=] 
因此 
— = DER. 3. 6) 
1 一 >) +a) 
ww 1 
max( p,q) 
>» Btad<1 WER 
i=] 


成 立时 ，o? 是 有 界 的 .可 以 证 明 该 条 件 是 GARCH(p，g) 模型 弱 平稳 的 充 要 条 件 . 〈 记 得 我 们 
WA a, 0,…，,ap 宇 0 和 及 三 0,…,8 三 0) 此 后 ， 为 了 符号 简便 ， 我 们 假设 p 二 4g. 

与 ARCH(1) 模型 的 情况 一 样 ，GARCH 模型 的 高 阶 矩 的 有 界 性 会 对 系数 提出 更 严格 的 
要 求 ; 参阅 Ling 和 McAleer(2002). 而 且 ， 即使 新 息 是 正 态 的 ，GARCH 模型 的 平稳 分 布 一 


般 也 是 厚 尾 的 . 
为 了 预测 步 向 前 的 条 件 方差 o24,1,， 我 们 可 以 重复 前 面部 分 的 讨论 来 推导 递归 公式 ， 当 


ee ee O 


h>p tł, A 
p 
Cale = wt > Ca; + Bonnie (12. 3. 8) 
=] 
Pp P 
dha = tt Dadin H DB Ferde (12. 3. 9) 
i=] i=1 
其 中 
co = rias hod (12. 3. 10) 
并 且 
2 ar td (12. 3. 11) 
Otth-ilHh~i i Nee ne 其 他 a Ue 


使 用 GARCH(1，1) 模 型 可 以 很 好 地 解释 条 件 方差 的 计算 过 程 ， 假 设 有 个 观测 值 x,， 
TE DaRi LE 9 且 有 
dh- = w +H airh + Boti (129.12) 
当 2 志和 之 n， 为 计算 条 件 方差 ， 需 设 定 初始 值 oj。。 可 以 令 其 等 于 平稳 假设 下 的 平稳 无 条 件 方 
% P=e/AQ-a—f) RPMS i. 之后， 我 们 可 以 使 用 定义 GARCH 模型 的 公式 计算 
oii 有趣 的 是 ， 观 察 到 
Gea 一 (1 一 al — Pde’ tari + Adii- (12. 3. 13) 
因此 ， 条 件 波动 率 的 一 步 向 前 预测 是 长 期 方差 、 即 期 收益 率 的 平方 值 以 及 即 期 条 件 波 动 率 估 计 
值 的 加 权 和 平均， 进一步， 条件 方差 的 MA(ce) KERAMA 
dh = P +a + Arte tAr thir +) (12.:3.44) 
是 过 去 收益 率 平方 值 的 无 穷 阶 滑动 平均 .公式 表明 ， 很 久 以 前 的 收益 率 平方 具有 指数 衰减 的 权 数 , 
反之 ， 收 益 率 平方 值 的 简单 滑动 平均 有 时 可 以 用 来 估计 条 件 方差 ， 但 这 些 方法 都 是 高 度 有 偏 的 . 
ME a 十 有 =1， 那 么 GARCH(1，1) 模型 是 非 平稳 的 ， 作 为 蔡 代 被 称 为 IGARCHC, 1) 
模型 ， 其 中 字母 I 代表 求 和 .这 种 情况 下 ， 我 们 应 该 从 符号 中 去 掉 下 标 并 令 a 二 1 一 8 假设 w= 
0， 则 
gin = (1— Pry + Bria teri t+ Prin +) (12. 3. 15) 
是 过 去 收益 率 平 方 的 指数 加 权 平 均 . 金融 领域 著名 的 Riskmetrics 软件 运用 B= 0.94 的 
IGARCH(1, 1) 模型 来 估计 条 件 方差 ; 参阅 Andersen 等 (2006). 
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对 于 正 态 新 息 可 以 容易 地 推导 出 GARCH 模型 的 极 大 似 然 函 数 . 我 们 举例 说 明 平 稳 
GARCH(1, 1) 模型 的 计算 过 程 . 结论 可 以 直接 推广 到 一 般 情况 .给 定 参 数 w，a 和 有 的 值 ， 
则 条 件 方差 可 以 由 以 下 公式 递归 计算 : 

o = w tart- + Borie (12. 4. 1) 
其 中 2, MEE TERE FRR WEBER 0 =0/A-a—p). RNR 
件 pdf 
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FC, | retr) = expl— ri / Cone) ] (12. 4. 2) 
PA es 1 
和 联合 pdf 
Fret) = Freee ar flr, | rs sr ) (12. 4. 3) 
迭代 最 后 一 个 公式 并 求 自 然 对 数 得 出 下 面 的 对 数 似 然 函 数 公 式 ， 
L(wsaB) 一 一 下 log(2r) — + >) {log(ot ua) + r/o (12. 4. 4) 
r=] 


w a ME HRKUA RST RA TAA EA LOE A E R KRAE A BUE PG 
到 ， 可 以 证 明 极 大 似 然 估计 量 近似 服从 均值 为 真 值 的 正 态 分 布 . CRH n AAA 
阵 ， 记 作 4， 可 以 按 如 下 方式 计算 得 到 + 


“| 
是 参数 向 量 . 0 的 第 i 个 分 量 记 为 8,， 所 以 一 w， 负 一 a， 把 二 BB A 的 对 角 线 元 素 是 估计 量 的 
近似 方差 ， 而 非 对 角 线 元 素 是 它们 的 近似 协 方差 . 因此 ，A 对 角 线 上 的 第 一 个 元 素 是 6 的 近似 
TH. A 和 矩阵 的 第 (1，2) 位 置 上 的 元 素 是 6 和 & 之 间 的 近似 协 方差 ， 以 此 类 推 ， 下 面 概述 计算 
A 的 过 程 . 对 详细 的 数学 计算 过 程 不 感 兴趣 的 读者 可 以 跳 过 这 段 . 3X3 符 阵 4 近似 等 于 以 下 
这 个 3X3 SAMs, AG. D 位 置 的 元 素 为 

L531 ne Bote (12. 4. 6) 


2 i=] Frl ad; oð; 
AR HA SRB O12. 4. 1) 微分 来 递归 得 到 ， 例 如 ， 方程 (12.4. 1) 两 边 同时 
对 w 求 微分 得 到 递归 公式 


(12. 4. 5) 


Ədil- Jije 2 
— ] RE b C 
+B (12. 4. 7) 


其 他 的 偏 导数 也 可 以 类 似 计 算 . 

记得 在 上 一 节 中 ， 模 拟 的 GARCH(1，1) 序列 被 识别 为 GARCH(1, 1) 模型 或 者 GARCH 
(2, 2) 模型 ，GARCH(2，2) 模型 的 拟 合 结果 报告 在 图 表 12-23 中 ， 甚 中 的 佑 计量 用 a0 表示 ， 
a 的 估计 量 用 al 表示 ，B 的 估计 量 用 bl 表示 ， 以 此 类 推 ， 注 意 ， 尽 管 a2 接近 显著 水 平 ， 但 没 
有 一 个 系数 是 显著 的 ， 用 GARCH(1，1) 模型 拟 合 的 模型 如 图 表 12-24 所 示 . 


图 表 12-23 ”模拟 的 GARCH(1, 1) 序列 的 GARCH(2, 2) 模型 估计 


系 数 fa it tp HE iA Ze : {A Pet 一 | ii) 
ad 1. 835e-02 1. 515e-02 1.211 0. 2257 
al 4. 09e-15 4. 723e-02 8. 7e-14 1. 0000 
af 1. 136e-01 5. 855602 1. 940 0. 0524 
bl 3. 369e-01 3. 696e-01 0. 911 0. 3621 
b2 5. 100e-01 3. 575e-01 1. 426 0. 1538 


> gl=garch(garchl1l.sim,order=c (2,2) ) 
> summary (g1) 


ĖS 
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图 表 12-24 模拟 的 GARCH(1, 1) 序列 的 GARCH(1, 1) 模型 估计 


系 数 fi it 标准 误差 t ffi Pr(> |e!) 
a0 0. 007 575 0. 007 590 0. 998 0. 3183 
al 0. 047 184 0. 022 308 2.115 0. 0344 
bl 0. 935 377 0. 035 839 26. 100 <0. 0001 


> g2=garch(garchll.sim, order=c(1,1)) 
> summary (g2) 


现在 所 有 的 系数 估计 量 (除了 a0) 都 是 显著 的 . WAM GARCH(2, 2) 模型 的 AIC 是 
961.0， 而 拟 合 的 GARCH(1，1) 模型 的 AIC 是 958. 0， 因 此 GARCH(1, 1) 模型 对 数据 的 
拟 合 程度 更 好 . (这 里 ，AIC 定义 为 一 2 乘 以 拟 合 模型 的 对 数 似 然 值 与 参数 数量 的 2 ZA. 
就 像 在 ARIMA 模型 的 情况 下 一 样 AIC 越 小 越 好 . 》 参数 95%% 的 置信 区 间 通 过 估计 量 土 1. 96 
倍 的 标准 误差 来 GW WA. 因此 ，w 的 近似 95% 的 置信 区 间 是 (一 0.0073，0. 022)，ai 的 
等 于 (0.003 45，0. 0909)，B, 的 等 于 (0.865, 1.01). 这 些 置信 区 间 分 别 包含 了 它们 各 自 的 真 


实 值 0.02，0.05 和 0. 9， 注意 bl 的 标准 误差 是 0.0358， 因为 标准 误差 与 1/Vn 大 约 成 正比 ， 如 
果 样 本 容量 n 是 200(300〉 的话 ， 那 么 bl 的 标准 误差 应 该 大 约 是 0.0566(0. 0462). 事实 上 ， 
对 前 200 个 模拟 数据 拟 合 GARCH(1，1) 模 型， 发现 bl 等 于 0. 0603， 标 准 误差 等 于 50. 39! 
当 样本 容量 增加 至 300 时 ，bl 等 于 0. 935， 其 标准 误差 等 于 0.0449. 这 个 例子 说 明 ， 为 了 使 
得 理论 上 的 样本 分 布 有 效 和 有 用 ， 拟 合 GARCH 模型 需要 较 大 的 样本 容量 .参阅 Shephard 
(1996， 第 10 H) 的 相关 讨论 . 

对 CREF 收益 率 数据 ， 我 们 前 面 识别 为 GARCH(1，1) 模型 或 GARCH(2，2) 模型 ， 拟 
AW GARCH(1，1) 模型 的 AIC 为 969. 6， 而 拟 合 的 GARCH(2, 2) 模型 的 AIC 为 970. 3. 
因此 数据 的 GARCH(1，1) 模型 拟 合 度 略 优 ， 拟 合 GARCH(1，1) 模型 的 极 大 化 似 然 估计 报 
告 在 图 表 12-25 H. 

图 表 12-25 CREF 股票 收益 率 GARCH(1, 1) 模型 的 极 大 化 似 然 估计 


系 数 fi it? 标准 误差 t 值 Pr(> |t|) 
a0 0. 016 33 0. 012 37 1. 320 0. 1869 
al 0. 044 14 0. 020 97 2. 105 0. 0353 
bl 0. 917 04 0. 045 70 20. 066 <0. 0001 


> ml=garch (x=r.cref,order=c(1,1)) 
> summary (m1) 


>eumary(m) 四 /< 人 于- 二 二 二 

四 如 前 所 述 ， 分 析 依 赖 于 其 测 的 尺度 ， 特 别 地 ， 对 原始 CREF 股票 收益 率 拟 合 GARCHO, 1) 模型 得 到 a0 一 0. 000 005 11, 

al 一 0.0941，bl 一 0. 789, 

注意 ，GARCH(1，1) 模型 的 长 期 方差 可 以 如 下 估计 : 

of —¢-p = 0. 016 33/(1 — 0. 044 14 — 0. 917 04) = 0. 4206 Cie 428) 

非常 接近 样本 方差 0. 4161. 

实际 上 ， 新 息 不 必 是 正 态 分 布 的 事实 上 ， 许 多 金融 时 间 序 列 的 新 息 看 上 去 都 是 非 正 态 
的 ， 尽 管 如 此 ， 仍 然 可 以 假设 新 息 是 正 态 的 ， 进 而 估计 GARCH 模型 ， 所 得 似 然 函 数 称 为 高 
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斯 似 然 函数 ， 极 大 化 高 斯 似 然 函 数 得 出 的 估计 量 称 作 准 极 大 似 然 估计 CQMLE). 可 以 证 明 ， 
在 包含 平稳 性 在 内 的 某 些 温和 的 正则 条 件 下 ， 准 极 大 似 然 佑 计量 近似 服从 正 态 分 布 ， 围 绕 于 人 参 
数 真 实 值 周围 ， 其 协 方差 阵 为 (x 十 2)/2]4A4， 其 中 ,wc 是 新 息 的 〈 额 外 的 ) 峰 度 ，4 是 假设 新 
息 为 正 态 分 布 时 的 协 方差 阵 一 一 见 上 述 关 于 正 态 情况 的 讨论 ， 注 意 ， 新 息 的 厚 尾 性 将 造成 协 方 
差 矩 阵 脱 大 ， 从 而 导致 参数 估计 量 的 可 靠 性 降低 ， 当 新 息 确实 非 正 态 时 ， 该 结论 提出 了 一 种 修 
正 准 极 大 化 似 然 估 计 标 准 误差 的 简单 方法 ， 即 在 正 态 新 息 假 设 下 ， 用 惯常 的 (二 2)72 乘 以 高 
斯 似 然 估计 的 标准 误差 ， 其 中 可 由 如 下 定义 的 标准 残 差 样本 峰 度 替代 . 应 当 注 意 ，QMLE 
的 一 个 缺陷 是 ， 严 格 说 起 来 AIC 值 并 不 适用 . 
令 估 计 的 条 件 标准 误差 用 5,1 ,-, 表 示 ， 则 标准 残 差 被 定义 为 

Ê, = rif gies (12. 4. 9) 
从 拟 合 模型 得 到 的 标准 残 差 可 以 作为 新 息 的 代理 变量 ， 并 且 对 它 的 检验 可 以 使 我 们 了 解 新 恩 的 
分 布 形式 ,一旦 新 息 (参数 化 ) 的 分 布 被 设 定 ， 例 如 上 分布， 则 可 以 推导 出 相应 的 似 然 函数 ， 
并 且 通 过 最 优化 得 到 极 大 似 然 估 计量 .详细 资料 可 查阅 Tsay(2005). 没有 正确 识别 新 县 分 布 
形式 的 代价 是 估计 有 效 性 的 降低 ， 虽 然 使 用 较 大 数据 集 时 ， 高 斯 似 然 估 计 方 法 的 计算 便利 性 比 
估计 有 效 性 的 降低 更 重要 、. 


12.5 模型 诊断 


在 我 们 接受 拟 合 模型 并 解释 其 结果 之 前 ， 必 须 检验 模型 是 否 被 正确 识别 ， 即 数据 是 否 文 持 
模型 的 假设 条 件 ， 如果 违 反 了 一 些 关键 的 模型 假设 ， 那 么 一 个 新 模型 应 该 被 识别 、 拟 合 ， 并 且 
再 次 检验 ， 直 到 发 现 一 个 能 充分 拟 合 数据 的 模型 . 回忆 标准 残 差 的 定义 是 

È = 天 /人 (12.5.1) 
如 果 模 型 被 正确 识别 ， 残 差 是 独立 同 分 布 的 ， 与 对 ARIMA 模型 进行 模型 诊断 的 情况 一 样 ， 标 
准 残 差 对 检验 模型 的 识别 是 非常 有 用 的 . 新 息 的 正 态 性 假设 可 以 通过 QQ 正 态 得 分 图 来 考察 . 
QQ 图 中 偏离 直线 的 模式 为 非 正 态 性 提供 了 证 据 ， 并 且 可 以 为 新 息 的 分 布 形式 提供 线索 . Sha- 
piro-Wilk 检验 和 Jarque-Bera 检验 对 正式 检验 新 息 9 的 正 态 性 是 有 用 的 ， 

对 于 用 模拟 的 GARCH(, D 过 程 拟 合 的 GARCH(1，1) 模型 ， 其 标准 残 差 的 样本 偏 度 
和 峰 度 分 别 等 于 一 0. 0882 和 一 0. 104. 但 是 ，Shapiro-Wilk 检验 和 Jarque-Bera 检验 都 表明 标准 
残 差 是 正 态 的 ， 

对 于 用 CREF 收益 率 数据 拟 侣 的 GARCH(I，I) 模型 ， 其 标准 残 差 绘制 在 图 表 12-26 中 . 
图 形 存 在 一 个 趋势 ， 越 接近 研究 期 的 末 段 ， 残 差 的 值 越 大 ， 这 也 许 能 说 明 残 差 波动 率 中 存在 某 
种 模式 ， 标 准 残 差 的 QQ AWA 12-27. QQ 图 显示 了 很 大 程度 上 是 直线 的 图 形 模式 . 标准 
残 差 的 偏 度 和 峰 度 分 别 是 0.0341 和 0. 205. Jarque-Bera 检验 的 p (AST 0.58, Shapiro-Wilk 


© Chen 和 Kuan(2006) 证 明了 用 GARCH 模型 残 差 进行 的 Jarque-Bera 检验 在 正 态 新 息 的 零 假设 下 ， 不 再 服从 卡 方 分 
布 ， 他 们 的 模拟 结果 表明 ， 在 这 种 情况 下 ，Jarque-Bera MATH: 即 比 名 义 显著 水 平 更 大 的 概率 拒绝 正 态 性 
假设 ， 作 者 提出 了 修正 的 Jarque-Bera 检验 ， 渐 近 保 留 了 卡 方 零 分 布 ， 同样 地 ， 可 以 预料 到 ， 对 GARCH 模型 的 成 
差 进 行 Shapiro-Wilk 检验 时 ，Shapiro-Wilk 检验 可 能 需要 修正 ， 尽 管 这 个 问题 目前 还 没有 解决 - 


检验 的 p (ASF 0. 34， 因 此 正 态 性 假设 不 能 被 拒绝 . 
图 表 12-26 对 CREF 日 收益 率 氢 合 的 GARCH(1, 1) 模型 的 标准 残 差 


标准 残 差 


时 间 
> plot (residuals (m1) ,type='h',ylab='Standardized Residuals') 


图 表 12-27 对 CREF 日 收益 率 拟 合 的 GARCH(1, 1) 模型 的 标准 残 差 的 QQ 正 态 得 分 图 

3 oo” 
2 

Fi} ] 

t 
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理论 分 位 数 


> win.graph (width=2.5,height=2.5,pointsize=8) 
> qqnorm(residuals (mi)); qqline (residuals (m1) ) 


如 果 GARCH 模型 被 正确 识别 ， 那 么 标准 残 差 (2) 应 该 是 近似 独立 同 分 布 的 ， 新 息 的 独 

立 同 分 布 假设 可 以 通过 它们 的 样本 acf 来 检验 .回忆 混合 统计 量 等 于 
nds ĝi 

其 中 & 是 标准 残 差 的 & 阶 滞后 的 自 相关 系数 ，? 是 样本 容量 . (回忆 一 下 ， 相 同 的 统计 量 也 被 
称 为 Box-Pierce 统计 量 ， 在 修正 版 本 中 ， 被 称 作 Liung-Box 统计 量 . ) 另外 可 证 ， 在 模型 被 正 
确 识别 的 零 假 设 下 ， 检 验 统计 量 渐 近 服 从 m TA EAS x? 分 布 ， 该 结果 基于 以 下 事实 ， 即 独 
立 同 分 布 序列 非 零 阶 滞后 的 样本 自 相 关系 数 是 渐 近 独立 正 态 分 布 的 ， 均 值 为 零 ， 方差 为 1/n. 
这 一 结论 对 标准 残 差 的 样本 自 相关 函数 也 大 体 成 立 ， 如 果 数 据 确实 是 由 与 拟 合 模 型 相同 阶 数 的 
GARCH 模型 生成 的 然而， 混合 检验 对 于 不 相关 但 也 不 独立 的 新 息 没 有 很 高 的 效 度 .事实 
上 ， 我 们 从 收益 率 数据 不 相关 的 假设 开始 ， 因 此 前 面 的 检验 没有 什么 意义 . 

通过 研究 绝对 标准 残 差 或 者 标准 残 差 的 平方 的 自 相关 结构 ， 可 以 设计 出 更 有 用 的 检验 ， 令 
绝对 标准 残 差 的 阶 滞后 自 相关 系数 用 A,, 表示， 标准 残 差 的 平方 的 相应 系数 用 B&&., RN. DF 
的 是 ， 基 于 2 (Geo) 的 相应 混合 统计 其 不 再 渐 近 服从 mm 个 自由 度 的 x 分布， 原因 在 于 对 未 知 
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参数 的 估计 对 检验 带 来 了 不 可 忽略 的 影响 ，Li 和 Mak (1994) 证 明 在 求 和 项 中 用 自 相 关 函 数 
的 二 次 型 代替 自 相 关 函 数 的 平方 可 以 保留 x* 渐 近 分 布 的 结论 ;也 可 以 参阅 Li(2003)， 对 绝对 
标准 残 差 ， 检 验 统计 量 形 如 


nD Dau Pi Dja (12.5. 22 
称 此 修正 检验 统计 量 为 广义 混合 检验 统计 量 ， 但 是 ，9g KTRK Em, HEMBANERSE 
模型 而 言 是 特定 的 ， 因 此 必须 通过 数据 估计 出 来 .对 残 差 平 方 ，g 取 不 同 的 数值 . 9 的 公式 见 
附录 L 
我 们 用 CREF 数据 来 说 明 广 义 混合 检验 ， 图 表 12-28 绘制 了 来 自 拟 合 模型 GARCH(1，1) 
的 标准 残 差 平方 的 样本 ACF 图 ， 在 数据 独立 同 分布 假 设 下 ， 图 形 中 (单独 的 ) 临界 限 是 基于 
1/n 倍 的 名 义 方差 如 前 所 述 ， 即 使 模型 被 正确 识别 ， 该 名 义 值 与 残 差 平方 的 自 相 关 孔 数 的 真 
实 方差 也 可 能 存在 很 大 的 区 别 ， 不 过 ， 从 图 形 得 出 的 总 体 印象 是 残 差 平方 序列 不 相关 . 


图 表 12-28 CREF 日 收益 率 的 GARCH(1, 1) 模型 的 标准 残 差 平方 的 样本 ACF 


> acf (residuals (m1) “2,na.action=na .omit) 


图 表 12-29 显示 了 广义 混合 检验 得 到 的 p 值 ， 其 中 的 标准 残 差 平方 得 自用 m= 二 1 到 20 的 
CREF 数据 拟 合 出 的 GARCH(1，1) 模型 .所 有 p 值 都 大 于 5 为 ， 说 明 残 差 平方 随时 间 不 相 
关 ， 因 此 标准 残 差 可 能 是 独立 的 . 


图 表 12-29 对 CREF 日 收益 率 GARCH(1，1) 模型 的 标准 残 差 平方 的 广义 混合 检验 的 p 值 


> gBox {ml,method='squared') 
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我 们 使 用 绝对 标准 残 差 重 新 对 模型 进行 检验 一 一 参阅 图 表 12-30 和 12-31. 根据 显示 的 名 
义 临界 值 ， 绝 对 残 差 的 2 阶 滞后 自 相 关系 数 显 著 ， AS, 4 m=2 和 3 时 ， 广 义 混合 检验 显著 ， 
(AS m=4 时 不 显著 .绝对 标准 残 差 的 样本 EACF 表 (没有 显示 ) 说 明 绝 对 残 差 满 足 ARC) 
模型 ， 因 此 指出 一 种 可 能 ， 即 CREF 收益 率 可 以 被 识别 为 GARCH(1，2) 过 程 ， 然 而， 对 
CREF 数据 拟 合 的 GARCH(1，2) 模型 没有 提高 拟 合 度 ， 因 为 它 的 AIC 是 978. 2 一 一 远 远 大 
于 拟 合 的 GARCH (1，1) 模型 的 AIC 值 969.6. 因此， 结论 是 GARCH(1，1) 模型 给 出 了 
CREF 数据 的 优良 拟 合 . 


图 表 12-30 CREF 日 收益 率 GARCH(1, 1) 模型 的 绝对 标准 残 差 的 样本 ACF 


> acf (abs (residuals (m1) ) ,na.action=na.omit) 


图 表 12-31 CREF 日 收益 率 GARCH(1, 1) 模型 的 绝对 标准 残 差 的 广义 混合 检验 p 值 


> gBox(m1,method='absolute') 


假设 GARCH(1，1) 模型 可 以 很 好 地 拟 合 CREF 数据 ， 则 可 用 其 预测 未 来 的 条 件 方差 . 
图 表 12-32 显示 了 条 件 方差 的 样本 内 估计 ， 图 形 反映 出 有 几 个 时 期 波动 率 较 高 ， 特 别 是 在 研究 
期 末端 的 那个 时 期 ， 在 最 后 的 时 点 上 ， 收 益 率 的 平方 等 于 2.159， 估 计 的 条 件 方差 为 0. 4411. 
结合 这 些 数值 以 及 方程 (12. 3. 8) 和 “(12. 3. 9)， 可 以 计算 未 来 条 件 方差 的 预测 值 ， 例 如 ， 条 
件 方差 的 一 步 向 前 预测 值 等 于 0. 016 33 十 0. 044 14X2.159 十 0. 917 04X0. 4411=0. 5161. 条 件 
方差 的 两 步 预测 值 等 于 0. 016 33 十 0. 044 14X0. 5161 十 0. 917 04X0. 5161=0. 5124. 以 此 类 推 ， 
随 着 步 长 的 增加 ， 预 测 最 终 副 近 模 型 的 长 期 方差 0. 420 66， 对 于 通过 Black-Scholes 公式 对 金 
融资 产 定价 并 计算 风险 价值 (VaR) 来 说 ， 条 件 方差 也 许 会 有 用 武之 地 ， 参 阅 Tsay(2005) 和 
Andersen 等 (2006). 
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有 趣 的 是 ， 对 AR(1) 十 异常 值 模型 的 残 差 进行 的 McLeod-Li 检验 也 支持 了 数据 中 需要 包 
括 ARCH WH; 参阅 图 表 12-9. 
图 表 12-32 估计 的 CREF 日 收益 率 的 条 件 方差 


0 100 200 300 400 500 
Í 


> plot ((fitted(m1) [,1])*2,type='1',ylab='Conditional Variance', 
xlab='t') 


12.6 条 件 方差 非 负 条 件 


因为 条 件 方差 于 ,必须 是 非 负 的 ， 因 此 GARCH 的 参数 通常 限于 非 负 数 ， 但 是 ， 参 数 的 
非 负 约束 并 不 是 条 件 方差 非 负 的 必要 条 件 . Nelson 和 Cao(1992) 最早 探讨 了 这 个 问题 ， 近 来 
的 研究 有 Tsai 和 Chan(2006). 为 了 更 好 地 理解 这 个 问题 ， 首 先 考虑 ARCH) 模型 ， 其 条 件 
FHA PRAY: 

dim = wtarre, Harr: +o + ar (12.6.1) 
假设 ¢ 个 连续 的 收益 率 可 以 取 任 意 的 实数 值 ，a 中 的 一 个 是 负数 ， 例 如 wm 二 0， 如 果 ri- 充分 
大 ， 其 余 r 都 足够 接近 于 0，、 那 么 oi1, 1 将 是 负数 . 因此， 为 了 保证 条 件 方差 非 负 ， 显 然 所 有 的 
a 必须 是 非 负 的 ， 类 似 地， 假设 收益 率 接 近 零 ， 则 w 必须 是 非 负 的 一 一 否则 条 件 方 差 会 成 为 负 
数 . 因此 对 于 ARCH 模型 来 讲 ，ARCH 模型 系数 的 非 负 性 是 条 件 方差 cil,-: 非 负 的 必要 充分 
条 件 . | 

对 于 一 个 GARCH(p，g) 模型 来 说 ， 相 应 的 问题 可 通过 把 GARCH 模型 表示 为 无 穷 阶 的 
ARCH 模型 来 研究 ， 条件 方差 过 程 (om) 是 以 收益 率 的 平方 作为 噪声 过 程 的 ARMA(p，g) 
模型 .前 面 讲 过 ， 如 果 AR 特征 多 项 式 的 所 有 根 在 单位 圆 之 外 的 话 ，ARMA(p，gq) 模型 就 可 
以 被 表示 成 MA(co) 模型 因此， 假设 1 一 Bz 一 妨 z 一 … 一 Bx?* =O 的 所 有 根 的 模 都 大 于 1, 
那么 条 件 方差 将 满足 等 式 

Ii = w” + hr + gari 十 …。 CIS non 
其 中 
w” = a| (1- 18) (12. 6. 3) 
简单 可 证 ， 当 且 仅 当 w* My (对 于 所 有 整数 j 宇 1) 时， 条件 方差 是 非 负 的 . 在 ARCH(co) 
表达 式 中 的 系数 与 GARCH 模型 的 参数 的 关系 满足 等 式 
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及 十 … 十 wwB， 
1p B- g5 MB +B + (12. 6. 4) 
? 


如 果 p=1, RIAK k>q 时 ，y 二 BJ-1. A, MHAM A0 KR Hh 0p [0 
时 ， 对 于 所 有 7 全 1 有 y 宇 0， 对 于 更 高 阶 的 GARCH， 情 况 更 加 复杂 . wa A<j<p) WK 
征 方程 的 根 : 


1 —- hx — = — ppr’ = 0 (12. 6. 5) 
不 失 一 般 性 ， 我 们 可 以 也 应 该 假设 以 下 约定 : 
[Ar IS] Az | SIA, | (12. 6. 6) 


今 i= 二 VvV 一 1 和 4 代表 4 HRI, Blz)=1—fPr—--—fz?, BVPABH—-HSERK RNA 
下 面 的 结论 ， 
结论 1: 考虑 GARCH(p，g) 模型 ， 其 中 p>2. Bi Al: 特征 方程 


1—fixr— hx’ ——Br?*=0 (12. 6. 7) 
的 根 的 模 大 于 1. 假设 A2: 所 有 以 上 的 根 都 不 满足 方程 
aiz += +a? 一 0 (12. 6. 8) 


则 下 面 的 结论 成 立 : 

(a) w 20, 4AM w20. 

(b) 假设 根 Ai s**t Ap 互 不 相同 ， 且 | Al | 一 | Az | , 那么 方程 (12. 6. 9) 给 出 的 条 件 是 对 
所 有 正 整 数 k, p 0 的 充分 必要 条 件 : 


Ai 为 实数 且 4 二 1 
a(A,) > 0 i (12.6.9) 
p >00 , k=l, =,k 
其 中 &" 是 最 小 的 整数 ， 大 于 或 等 于 
(12. 6. 10) 


对 p=2, Bie 1 定义 的 "可 以 被 证 明 等 于 gq 十 1; W Nelson 和 Cao(1992) 的 定理 2. 如 果 由 
等 式 (12. 6. 10) ELK k 是 一 个 负数 ， 那 么 可 以 证 明 对 于 所 有 正 数 上 ， 有 办 宇 0. WER 
Tsai Al Chan(2006). 

Tsai 和 Chan(2006) 还 推导 出 了 一 些 更 容易 验证 的 保证 条 件 方差 非 负 的 条 件 . 

结论 2: 设 结论 1 中 的 假设 成 立 ， 则 以 下 结果 成 立 : 

(a) 对 GARCH(p，1) 模型 ， 若 是 实数 且 人 >1,7 = 二 1,…,p， 并 且 al 宇 0， 那么 对 于 
MEIERS kA 内 二 0. 


$ 
(b) X} GARCH(p, 1) MM, RRA ERM kA p0, Ma0, DA S0, AK 


% H à >l. 
(c) 对 GARCH(3，1) 模型 ， 对 所 有 正 整 数 上 有 p20, HNH a20, FAW PEM 
情况 1. PATA A; FESR. a >l, Ar! 十 1z +à; 20. 
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WO2. >l, A5 = | ho | 2 二 a 十 bi， 其 中 a Mb EXN, b>0, 0<0<r: 

情况 2. 1，0 二 2x/r， 对 于 某 些 整数 7r 宇 3 有 是 1<a.</ a, |. 

情况 2.2. PG {2n/r | r53, 4, e), |à: | /Area ol, HE oe fv (x)=0 的 最 大 实 
数 根 ， 且 

ae sinl (n + 2 i 
faotr) =z — 7 Sel Ps | sinl + pe! 

其 中 n 是 使 得 sinl lat Doo H sin((n+2)6)>0 的 最 小 正 整数 . 

(d) 对 GARCH(3，1) 模型 ， 若 4 一 A 二 |à: | e*= 二 a 十 bi， 其 中 a Alb RLA, O>0, H 
aA; >l, WTF RATER Re, yy 0. 

Ce) X GARCH(4, 1) EH, AM ISSA, A; BRR, W {gy})” = 二 0 非 负 的 充分 必要 条 
件 是 a20, Ar Ag’ HAHA 20, ayo, 

TER, oo 是 方程 (12. 6. 11) 唯一 的 大 于 或 等 于 1 的 实数 根 。 Tsai 和 Chan(2006) 还 证 明 
如 果 GARCH(Cp，c) 模型 的 ARCH 系数 (a) 都 是 非 负 的 ， 且 相应 的 具有 非 负 系 数 oa 的 
GARCH(p, 1) 模型 满足 非 负 条 件 ， 那 么 该 模型 具有 非 负 的 条 件 方差 ， 


(12. 6. 11) 


12.7 GARCH 模型 的 一 些 扩展 


GARCH 模型 可 以 在 几 个 方面 进行 推广 ， 首先 ，GARCH 模型 假设 时 间 序列 的 条 件 均值 等 于 
零 ， 即 使 对 于 金融 时 间 序 列 ， 也 并 非 总 需 满足 这 个 很 强 的 假设 条 件 ， 在 更 一 般 的 情况 下 ， 条 件 均 
值 结构 可 以 用 ARMACu, v) 模型 来 刻画 ， 同 时 ARMA 模型 的 白 噪声 项 用 GARCH(p, 0 模型 
来 刻画 ， 特 别 地 ， 令 (Y) 表示 下 式 定义 的 时 间 序 列 (现在 换 用 符号 Y, 表示 一 般 的 时 间 序 列 )， 

Y, = A Y + e AA Y abo t e + hen +e Hee 

e, = Gill Êr (12. 7.1) 

ohi = w tH aeh He t ager g Hedh +t + Boo? pip 

其 中 在 模型 的 MA 部 分 ， 我 们 使 用 了 加 号 的 表示 习惯 ，ARMA 模型 的 阶 数 可 以 通过 时 间 序 列 
(Y,) 来 识别 ， 而 GARCH 模型 的 阶 数 可 以 通过 拟 合 的 ARMA 模型 的 残 差 平方 来 识别 ， 一 旦 
总 别 了 阶 数 ， 那 么 可 以 通过 极 大 化 方程 (12. 4.4) 中 定义 的 似 然 函数 对 ARMA 十 GARCH 模 
型 进行 完全 极 大 似 然 估 计 ， 但 方程 中 的 x, 要 替换 成 e,，e, 根据 方程 (12.7.1) 递归 计算 得 到 . 
如 果 新 息 e 的 分 布 是 对 称 的 〈 例 如 正 态 分 布 或 上 分 布 )， 并 且 标 准 误差 近似 地 由 纯 ARMA 情况 
给 出 ， 那 么 ARMA 参数 的 极 大 似 然 佑 计量 与 其 相应 的 GARCH 部 分 是 相互 渐 近 独立 的 ， 同 
样 ，GARCH 参数 估计 量 的 分 布 与 纯粹 GARCH 模型 情况 下 参数 估计 量 的 分 布 相似 . 但是， 
如 果 新 息 的 分 布 有 偏 ， 那 么 ARMA 佑 计量 和 GARCH 估计 量 是 相关 的 .下 一 节 ， 我 们 用 美元 
对 港币 的 日 汇率 数据 来 举例 说 明 ARMA 十 GARCH 模型 ， 

另 一 个 推广 的 方向 是 考虑 波动 率 过 程 的 非 线性 特点 .对 金融 数据 ， 考 虑 非 对 称 的 动机 是 可 
能 的 非 对 称 市 场 响应 ， 例 如 ， 对 负 收 益 率 响应 可 能 比 对 相同 程度 的 正 收益 率 的 响应 更 强 ， 这 个 
想法 可 以 通过 对 ARCH(1) 模型 的 设置 来 简单 地 说 明 ， 其 中 非 对 称 可 以 通过 以 下 设 定 来 建 模 ; 

dii = wteet, tymin(e,, ,0)° c12.7. 29) 
该 模型 的 一 种 变化 是 允许 门限 未 知 并 且 不 等 于 0. 了解 


这 样 的 模型 被 称 为 GJR 模型 
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GARCH 模型 的 其 他 有 用 的 扩展 可 参阅 Tsay(2005). 


12.8 另 一 个 示例 : USD/HKD 汇率 日 数据 


作为 ARIMA+GARCH 模型 的 实例 ， 考 虑 2005 年 1 月 1 日 到 2006 年 3 月 7 日 每 日 USD/ 
HKD (美元 对 港币 ) 汇率 ， 总 共 431 天 的 数据 .显示 在 图 表 12-33 中 的 汇率 日 收益 率 看 起 来 是 
平稳 的 ， 虽 然 图 形 中 存在 明显 的 波动 集群 . 


图 表 12-33 USD/HKD 汇率 日 收益 率 : 1/1/05 一 3/7/06 


0 100 200 300 400 


> data (usd.hkd) 
> plot (ts (usd. hkd$hkrate, freq=1) ,type='1',xlab='Day', 
ylab='Return') 


有 趣 的 是 ， 对 AR(1) 十 异常 值 模型 的 残 差 应 用 McLeod-Li 检验 时 ， 结 果 同 样 证 实 需要 在 
数据 中 体现 ARCH. 参阅 后 面 关于 可 加 异常 值 的 进一步 讨论 ， 图 表 12-34 表明 当 残 差 平 方 目 相 
关系 数 的 滞后 阶 数 从 1 到 26 时 ,检验 全 部 显著 ， 显 示 出 存在 条 件 异 方差 的 有 力 证 据 ， 


图 表 12-34 对 USD/HKD 汇率 的 McLeod-Li 检验 


0 5 10 15 20 25 . 


0 一 


> attach (usd.hkd) 
> McLeod.Li.test (arima(hkrate,order=c({1,0,0), 

xreg=data.frame(outlierl))) 
-一 


x} CG) 收益 率 数 据 拟 合 一 个 具有 可 加 异常 值 的 AR(1) 十 GARCH(3，1) 模型 异常 值 定 
义 为 2005 年 7 月 22 日 之 后 的 一 天 ， 当 日 中 国 对 人 民 币 元 重新 估 值 升值 2. 1% 并 采取 浮动 汇率 体 
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系 ， 图 表 12-33 中 异常 值 用 灰色 阴影 表示 ， 可 以 发 现 ， 条 件 均值 方程 中 的 截 距 项 并 不 显著 地 异 于 
0， 因 此 模型 予以 省 略 ， 这 样 ， 收 益 率 均值 无 条 件 地 取 零 。 拟 合 模型 具有 AIC=—2070.9, HA 
同 的 竞争 ( 弱 ) 平稳 模型 中 是 最 小 的 一 一 参阅 图 表 12-35， 有 趣 的 是 ， 对 于 GARCH 更 低 的 阶 数 
(ps 二 2)， 拟 合 模型 是 非 平稳 的 ， 但 是 当 GARCH 阶 数 大 于 2 时， 拟 合 模型 基本 上 是 平稳 的 .因为 
数据 看 起 来 是 平稳 的 ， 我 们 选择 AR(1) 十 GARCH(3，1) 模型 为 最 终 模 型 . 

在 图 表 12-35 中 所 部 分 展示 的 AR+GARCH 模型 是 应 用 SAS 软件 的 Proc Autoreg 程序 
拟 合 的 .为 了 保证 GARCH 条 件 方差 这 程 非 负 ， 我 们 使 用 了 默认 选项 对 模型 施加 Nelson-Cao 
不 等 式 约 束 . (BRAM pooh, 施加 的 不 等 式 约束 才 是 保证 GARCH(p，g) 模型 的 条 件 方 
差 非 负 的 充分 必要 条 件 ， 对 于 更 高 阶 GARCH 模型 ，Proc Autoreg 施加 的 约束 是 (1)y 宇 0, 
1<k<max(q—1, p)+1, (2) 样本 内 条 件 方差 的 非 负 性 ; BR SAS 9. 1. 3 帮助 文件 和 操作 手 
册 . 因此 用 具有 Nelson-Cao 选项 的 Proc Autoreg hitti E apr GARCH 模型 并 不 一 定 以 概率 
1 得 到 非 负 条 件 方差 . 

图 表 12-35 ”对 USD/HKD 汇率 日 收益 率 氢 合 的 不 同 模型 的 AIC 值 


GARCH ARCH 、 GARCH ARCH 
ARB kao mao ^O TAR ARAE hao mao ^C Yen 
0 3 1 一 1915.3 A| 1 | 3 1 -2070.9 ”平稳 
1 1 1 — 2054. 3 非 平稳 1 3 2 — 2064. 8 平稳 
1 1 2 一 2072.5 非 平稳 1 3 3 一 2062.8 平稳 
1 1 3 —2051.0 非 平 稳 1 4 1 一 2061. 7 非 平稳 
1 2 1 — 2062. 2 非 平稳 1 4 2 — 2054. 8 平稳 
1 2 2 — 2070. 5 非 平稳 | 1 4 3 — 2062. 4 平稳 
1 2 3 —2059.2 非 平稳 2 3 1 2066.6 ey 


对 中 国 香港 的 汇率 数据 ， 由 Proc Autoreg 得 到 的 拟 合 模型 列 于 图 表 12-37 中 ， 估 计 的 条 件 
方差 显示 在 图 表 12-36 中 ， 注 意 GARCH2(B,) 系数 的 估计 值 是 负 的 . 
图 表 12-36 HA AR(1)+GARCH(3, 1) 模型 中 USD/HKD 汇率 日 收益 率 的 估计 条 件 方差 
0.008 f = or. = _-. l 


> plot (ts (usd.hkd$v, freq=1) ,type='1',xlab='Day', 
ylab='Conditional Variance') 
a -一 


© SAS 的 Proc Autoreg 程序 有 一 个 选项 可 以 对 GARCH 模型 施加 Nelson-Cao 不 等 式 约束 ， 此 处 使 用 了 该 约束 . 
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因为 截 距 和 ARCH 系数 都 是 正 数 ， 我 们 可 以 运用 结论 2 中 的 (ce) 部 分 来 检验 拟 合 模型 定义 
的 条 件 方 差 过 程 是 否 总 是 非 负 的 ， 特征 方程 1 一 x 一 让 一 访 x 二 0 允许 三 个 根 等 于 1. 153 728 和 
一 0. 483 294 士 1. 221 4741. KJE A, =1.153 728 i | à: | /A, = 1.138579. 根据 数值 计算 ， 方程 
(12.6.11) P n WHBABRH2, HAD (12.6.11) 有 一 个 实 根 等 于 1.138 5751, KER 
根 严 格 地 小 于 1. 138 579 二 |à: | /Ai 因此 可 得 结论 为 ， 拟 合 模型 总 是 会 得 到 非 负 的 条 件 方差 . 


图 表 12-37 对 USD/HKD 汇率 日 收益 率 拟 合 的 AR(1) 十 ARCH(3，1)】 模型 


系 数 估计 值 标准 误差 t 比率 户 值 
AR] 0. 1635 0. 005 892 21. 29 0. 0022 
ARCHOCw) 2.374% 1075 6.93107 * 3. 42 0. 0006 
ARCHI Ca ) 0. 2521 0.0277 9.09 <0. 0001 
GARCHI(f) 0. 3066 0. 0637 4. 81 <0. 0001 
GARCH2() — 0. 094 00 0. 0391 —2. 4] 0.0161 
GARCHI?) 0. 5023 0. 0305 16. 50 <0. 0001 
异常 值 “0, 1255 0, 005 89 — 21, 29 <0. 0001 


> SAS code: data hkex; infile 'hkrate.dat'; input hkrate; 
outlierl=0; 
day+1; if day=203 then outlierl=1; 
proc autoreg data=hkex; 
model hkrate=outlierl /noint nlag=1 garch=(p=3,q=1) 
maxiter=200 archtest; 
/*hetero outlier /link=linear;*/ 
output out=a cev=v residual=r; 


Fun; 
EE 


12.9 小 结 


本 音 首 先 简单 描述 了 一 些 与 金融 时 间 序 列 有 关 的 术语 和 间 题 ， 继 而 为 建立 时 间 序 列 方差 变 
化 的 模型 引信 了 自 回归 条 件 异 方差 (ARCH) BA. 还 深入 研究 了 有 关 1H ARCH 模型 从 识 
别 直 到 参数 估计 和 预测 等 方面 的 问题 ， 然 后， 将 其 推广 到 广义 自 回 归 条 件 民 方才 GARCH(p, 
g) 模型 的 研究 上 ， 涵 盖 了 识别 、 极 大 似 然 估 计 、 预 测 和 模型 诊断 等 方面 的 内 容 ， 本 章 还 同时 
以 模拟 的 和 真实 的 时 间 序 列 数据 为 例 ， 对 相关 思想 进一步 加 以 阐释 . 


习题 

12.1 MH CREF 数据 绝对 收益 率 的 时 间 序 列 图 .再 画 出 收益 率 平方 的 图 .就 图 形 中 观察 到 的 
波动 模式 进行 评论 。( 数 据 在 名 为 CREF 的 文件 中 . ) 

12.2 ji} USD/HKD 汇率 绝对 收益 率 数据 的 时 间 序 列 图 .再 画 出 收益 率 平方 的 图 形 ， 对 这 
些 图 形 中 观察 到 的 波动 模式 进行 评论 . 〈 数 据 在 名 为 usd. hkd 的 文件 中 . ) 

12.3 使 用 定义 parol: [方程 (12. 2.4)」 并 证 明 int 是 一 个 序列 不 相关 过 程 ， 同样 
证 明 p 与 过 去 的 收益 率 平方 是 不 相关 的 ， 即 证 明 对 于 A>O, Corr(gm> ri) =0. 

12.4 把 加 一夫 一 六 带 人 方程 (12. 2. 2) ， 推 导 得 到 方程 〈12. 2. 5) 的 代数 运算 过 程 . 
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12.5 
12. 6 


12.7 


12.8 


12.9 


证 明 方 程 (12. 2. 8). 

不 做 任何 理论 计算 ， 对 以 下 四 种 分 布 的 峰 度 按 升 序 排序 ，10DF 的 上 分 布 ，30DF 的 上 分 

布 ， 在 [一 1，1j 上 的 均匀 分 布 ， 均 值 为 0 方差 为 4 的 正 态 分 布 ， 解释 结论 . 

模拟 一 个 长 度 为 500, a 二 0.1，B8 二 0.8 的 GARCH(1，1) 过 程 ， 画 出 时 间 序 列 图 ， 并 

查验 其 样本 ACF, PACF 和 EACF. 数据 与 白 品 声 的 假设 一 致 吗 ? 

(a) 把 数据 平方 ， 根 据 平 方 数 据 的 样本 ACF, PACF 和 EACF 对 原始 数据 识别 一 个 
GARCH 模型 . 

(b) 识别 一 个 基于 样本 ACF, PACF 和 数据 绝对 值 的 EACF 的 原始 数据 的 GARCH 模 
型 .对 于 分 别 由 平方 数据 和 绝对 值 数据 识别 的 暂 定 模 型 ， 讨 论 并 调整 二 者 间 的 任何 
差异 . 

(c) 对 模拟 的 序列 进行 McLeod-Li 检验 ， 有 何 结论 ? 

(d 现在 仅 使 用 前 200 个 模拟 数据 重复 以 上 练习 . 讨论 新 的 发 现 . 

文件 cref. bond 包含 了 CREF 债券 基金 从 2004 Æ 8 H 26 日 至 2006 年 8 月 15 日 的 每 日 

价格 .虽然 数据 只 能 在 交易 日 获得 ， 但 是 分 析 中 假设 其 得 日 等 回 隅 采样 过 程 . 

(a) 画 出 债券 价格 日 数据 的 时 间 序 列 图 ， 并 评论 数据 中 的 主要 特点 . 

(b) 通过 对 数据 做 对 数 变 换 然后 对 变换 后 的 数据 进行 一 次 差分 计算 债券 日 收益 率 ， 画 出 
债券 日 收益 率 的 图 形 ， 并 评论 结果 ， 

Cc) 对 收益 率 序 列 进行 McLeod-Li 检验 . SFI RITA? 

(d) 证 明 CREF 债券 价格 收益 率 序列 是 独立 同 分 布 的 并 不 仅仅 是 不 相关 的 ， 即 不 存在 可 
识别 的 波动 集群 . 

M 2004 42.8 H 20 RÆ 2006 49 A 13 H Google 股票 日 收益 率 保存 在 名 为 google 的 文 

eR, 

Ca) 画 出 收益 率 数 据 的 时 间 序 列 图 ， 并 说 明 数 据 在 时 域 上 为 本 质 无 关 的 . 

(hb) 计算 Google 日 收益 率 的 均值 ， 其 显 着 地 异 于 0 吗 ? 

(c) 对 Google 日 收益 率 序 列 施行 McLeod-Li 检验 ， 有 何 结 论 ? 

(d) 对 Google 日 收益 率 数据 识别 GARCH MW. 估计 识别 的 模型 并 对 拟 合 模型 进行 模 
型 诊断 检验 . 

(e) 绘制 并 评论 估计 的 条 件 方差 的 时 间 序 列 图 . 

(f) 对 来 自 拟 合 模型 的 标准 残 差 绘制 QQ 正 态 图 ， 残 差 看 起 来 是 正 态 的 吗 ” 讨 论 正 态 性 
对 模型 拟 合 的 影响 ， 例 如 ， 对 置信 区 间 计 算 的 影响 ， 

(g) 构造 bl 的 95% 的 置信 区 间 . 

(h) 根据 拟 合 的 GARCH 模型 ,平稳 均值 和 方差 各 是 多 少 ? 将 其 与 真实 的 量 进行 比较 . 

(i) 根据 GARCH 模型 ， 对 及 = 1,2,…,5 ， 构 造 声 步 向 前 预测 的 95%% 预 测 区 间 . 


12. 10 ”在 习题 11. 21 的 IMA(1，1) 模型 框架 中 ， 研 究 了 月 度 石油 价格 数据 取 对 数 后 的 异 稼 


值 的 存在 性 ， 这 里 探讨 了 “异常 值 ” 对 GARCH 设 定 的 影响 ， 数据 在 名 为 oil. price 的 

文件 中 . 

(a) 根据 来 自 拟 合 IMAC, 1) 模型 (没有 经 过 异 方差 调整 ) 的 残 差 的 绝对 值 和 平方 
值 的 样本 ACF, PACF 和 EACF, ERRA GARCHO, D 模型 或 为 适当 的 ， 
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Cb) 对 月 度 石油 价格 取 对 数 ， 拟 合 IMA(1，1) 十 GARCH(1，1) 模型 . 

(c) 绘制 来 自 拟 合 IMAC, 1)+GARCH(1, 1) 模型 的 标准 残 差 的 时 间 序 列 图 有 无 
异常 值 ? 

(d) 对 对 数 石 油价 格 ， 拟 合 在 :=2 Mr=—56 处 有 两 个 IO、 E t= 处 有 一 个 AO 的 
IMA(1，1) 模 型. 求证: Æ IMA 加 异常 值 模 型 中 ， 残 差 是 独立 同 分 布 的 ， 而 不 
仅仅 是 序列 无 关 的 ; 即 不 存在 可 识别 的 波动 集群 . 

(e) 在 异常 值 和 GARCH 模型 之 间 ， 你 认为 哪 一 个 更 适合 石油 价格 数据 呢 ? 解释 原因 . 


附录 1 广义 混合 检验 公式 

首先 给 出 用 标准 残 差 平 方 进行 混合 检验 情况 下 关于 Q= (cv) 的 公式 . 读者 可 以 参阅 Li 和 
Mak (1994) 来 查看 公式 的 证 明 . $ 6 HA GARCH 参数 和 向量. 例如， 对 GARCH(1，1) 
模型 ， 


(ig, i542 


用 0, 表示 9 的 第 i 个 分 量 ， 因 此 对 GARCH(, D) 模型 有 05w, =a, =f. 一 般 情况 下 ， 
A k=p+q+1 表示 GARCH 参数 的 个 数 . 令 本 为 m Xk 的 矩阵 ， 它 的 元 素 G, j 等 于 


E Pi: S daimi c 4 1) (12;.1.2) 


Ti mith wis 06; 
A 是 在 正 态 新 息 假设 下 ， 模 型 参数 OMRAUAEHERHMLESAHHOALE. BP 12.4 
节 . 令 Q= (gi,;) 为 广义 混合 检验 的 二 次 型 中 出 现 的 4 tee 可 以 证 明和 矩阵 Q 等 于 


Es re (12. I. 3) 


其 中 I 是 mXm 的 单位 矩阵 ，« 是 新 息 的 (超额 〉， 峰 度 ，J" 为 三 的 转 置 ， 上 标 一 1 表示 和 矩阵 
RČ. 
接 下 来 ， 给 出 基于 绝对 标准 残 差 计算 检验 统计 量 的 公式 ， 在 这 种 情况 下 ，J 和 矩阵 的 第 (i， 
j) 个 元 素 等 于 
+> Seti (| e em |- 2) (12. 1. 4) 


t azlr 1 


其 中 ， r— EC | E: | Js Q 等 于 


A] (12. 工 5) 


其 中 y=EC | el). 


第 13 章 谱 分 析 入 门 


历史 上 ， 谱 分 析 是 从 寻找 时 间 序 列 数据 里 “隐藏 的 周期 性 ”开始 的 .在 第 3 章 中 ， 对 于 具 
有 强 循环 趋势 的 序列 ， 我 们 讨论 过 在 各 种 已 知 频率 上 拟 合 余弦 趋势 的 问题 . 此 外 ， 第 2 章 随 机 
余弦 波 的 例子 说 明 ， 平 稳 过 程 可 能 貌似 一 个 确定 性 的 余弦 波 ， 在 第 3 章 里 我 们 也 暗示 了 使 用 足 
够 多 不 同 的 频率 、 振 幅 ( 以 及 相位 〉 就 能 对 几乎 所 有 的 平稳 序列 建 模 S .本 章 将 通过 谱 分 析 的 
介绍 进一步 深化 上 述 思 想 ， 之 前 我 们 集中 分 析 了 时 间 序 列 的 相关 性 质 ， 也 常 称 作 时 间 域 上 的 分 
析 . 在 对 时 间 序 列 的 频率 性 质 进行 分 析 时 ， 我 们 称 为 在 频率 域 上 进行 研究 ， 我 们 发 现 ， 频 域 分 
析 或 称 谱 分 析 ， 在 诸如 声学 、 通 信 工 程 、 地 球 物理 学 、 生 物 医学 等 各 领域 都 特别 有 用 . 


13.1 引言 

回忆 第 3 章 讲 过 的 余弦 曲线 方程 © 

R cos(2n ft + ®) (ia. 1,13 

这 里 R(>0) 为 曲线 的 振幅 ， 厂 是 频率 ， 臣 是 相位 ， 因 为 曲线 每 隔 1/f 时 间 单 位 取 值 重复 ， 所 
以 1/ 三 称 为 该 余弦 波 的 周期 . 

图 表 13-1 显示 了 时 间 从 1 到 96 的 两 个 离散 时 间 余 弦 曲 线 ， 虽然 只 能 看 到 离散 的 点 ， 但 通 
过 添加 连接 线段 将 有 助 于 我 们 看 出 其 模式 ， 两 条 曲线 的 频率 分 别 是 4/96 和 14/96， 其 中 较 低 
频率 曲线 的 相位 为 零 ， 而 较 高 频率 曲线 的 相位 移动 了 0. 6r. 


图 表 13-1 余弦 曲线 ，n=96， 两 种 频率 及 相位 


> win.graph (width=4.875,height=2.5,pointsize=8) 

> t=1:96; cosl=cos(2*pi*t*4/96) ; cos2=cos(2*pi* (t*14/96+.3)) 
> plot(t,cosl, type='o', ylab='Cosines') 

> lines (t,cos2,lty='dotted',type='o',pch=4) 


图 表 13-2 显示 的 是 上 述 两 条 余弦 曲线 线性 组 合 的 图 ， 其 中 低频 曲线 振幅 乘 2， 高 频 曲 线 振 
his FE 3 且 相 位 0. 6x; Bp 


O Hse, BUM 2. 25. 
加 ”本章 符号 与 第 3 章 稍 有 差异 . 
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Y,=2 a = 
: 二 cos( 2xt 96) +3 cos| 2n(t 36 +0. 3) | (13.1.2) 
这 里 周期 性 有 所 隐藏 ， 而 谱 分 析 给 我 们 提供 了 非常 容易 地 发 更“ 隐藏 ”周期 性 的 工具 . 4 
然 ， 这 一 时 间 序 列 不 会 一 点 儿 随 机 性 . 


图 表 13-2 ”两 条 余弦 曲线 的 线性 组 合 


> y=2*cosl+3*cos2; plot(t,y,type='0o', ylab=expression (y[t] }) 


从 前 面 看 出 ， 由 于 参数 R MO 并 非 线 性 地 进入 表达 式 ， 因 此 方程 13.1.1) 不 易 信 计 . 
为 方便 计 ， 我 们 用 三 角 恒 等 式 把 方程 (13. 1. 1) 重新 参数 化 为 


R cos(2xft +) = A cos(2nft) + B sin(2rft) (13.1.3) 

其 中 ， 
R= yJ +B, ®= atan(— B/A) 31-0 

反之 ， 
A=Rcos(®), B =— R sint®) (13.1.59) 


那么 ， 对 于 固定 频率 f, OUM cos(2xft) 和 sin(2xf1) 为 预测 变量 ， 使 用 普通 的 最 小 二 乘 回 
归 由 观测 数据 拟 合 出 A 和 B W. 
具有 任意 振幅 、 频 率 及 相位 的 m 个 余弦 曲线 的 一 般 线 性 组 合 可 以 写成 ” 


Y, =A, + 》)[Aicos(2r 记 1) + BysinQxf,t)] (13. 1. 6) 


普通 最 小 二 乘 回归 可 用 于 拟 合 A 和 B 的 值 ， 当 频率 取 特 殊 形式 时 ， 回 归 将 变 得 非常 简单 . 
假设 n 是 奇数 ， 并 可 写成 n= 二 2 十 1]， 则 形 如 1/n,2/n,….k/n (三 1/2 一 1/(2n)) 的 频率 称 为 傅 
里 叶 频 率 ， 在 这 些 频 率 (及 f=0 时 ) 上 的 余弦 及 正弦 预测 变量 已 知 是 正 交 的 >， 则 最 小 二 乘 
估计 就 是 

A, =Y cg? le) 
: eB 


A, = 2 QY.cost2atj/n), ĝ, = É D YesinC2ntj /n) (13. 1. 8) 


r=] r=] 


O A 项 可 看 做 余弦 曲线 在 频率 为 零 时 的 系数 ， 余 强 取 值 为 1， 同 样 Bo MAME KR ee AR BY ERM 
也 是 1， 所 以 函数 形式 都 略 去 不 写 . 
O 更 多 有 关 正 芯 、 余 弦 正 交 性 的 信息 ， 请 参考 附录 I. 
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若 样 本 量 为 偶数 ， 比 如 n=2k, WR (13.1.7) 和 (13.1.8) 对 j= 1,2,…, 上 一 1 仍然 

成 立 ， 但 是 
he S B, 一 0 (13. 1. 9) 
EERE f, =k/n=1/2. 

如 果 将 上 述 公式 应 用 到 图 表 13-2 的 序列 上 ， 能 够 得 到 很 好 的 结果 .也 就 是 说 ， 在 频率 f= 
4/96 E, HÂ =2, B,=0. 在 频率 fu 二 14/96 上 ， 得 出 A, =—0. 927051, ĝ,=— 2. 85317. 
在 其 他 所 有 频率 上 回归 系数 的 估计 值 为 零 . 因为 序列 设 有 随机 性 ， 所 有 可 得 到 上 述 结果 ， 且 余 
I-E A ME E Ew H. 

也 需 注意 对 任意 长 度 为 n 的 序列 ， 无 论 它 是 确定 性 的 还 是 随机 的 ， 也 无 论 其 有 无 真正 的 
周期 性 ， 都 能 够 用 方程 3.1.6) 中 的 模型 予以 完美 的 拟 合 ， 其 中 当 半 为 偶数 时 ， 取 mx 一 n/ 
2， 当 nn 为 奇数 时 ， 取 m= 二 (n 一 1)/2， 而 为 拟 合 长 度 为 的 序列 ， 有 nn 个 参数 可 供 调整 〈( 估 
计 ). 


13.2 周期 图 
当 样 本 量 为 奇数 ， 即 n 一 2k 十 1 时 ， 频 率 f= j/nCj 一 1,2,…,k) 上 的 周期 图 工 定义 为 
(L) = SA +B) (13. 2.1) 
若 样本 量 为 偶数 ， 即 n=2k 时 , WR 13.1.7) 和 (13.1.8) 仍 能 给 出 A 和 户 的 值 ， 方 程 
(13.2.1) 给 出 周期 图 ， 其 中 ;二 1，2，…， k—1. 但 是 在 极端 频率 f—k/n= 1/2 E, 方程 
(13. 1.9) 适用 ， 且 


(+) = n(A,)’ (13. 2. 2) 


因为 频率 f=j/n 上 的 周期 图 与 相应 回归 系数 的 平方 和 成 正比 ， 所 以 周期 图 的 高 峰 显 示 了 序 
列 整 体 行为 中 不 同 频率 上 余弦 -正弦 对 的 相对 强度 。 从 方差 分 析 的 角度 可 以 提出 另 一 个 解释 ， 
周期 图 IG/n) 是 频率 j/n 上 参数 对 (A, B) 相关 的 两 个 自由 度 的 平方 和 ， 这 样 当 nm 一 2 十 1 为 
奇数 时 可 得 到 
ZY —Y) = ey (13. 2. 3) 

当 n 是 偶数 时 ， 相 似 结论 成 立 ， 只 不 过 在 和 中 多 了 一 个 单一 自由 度 的 项 I(1/2). 

对 长 的 序列 ， 计 算 大 量 回归 系数 并 非 易 事 ， 幸 运 的 是 ， 应 用 基于 快速 傅 里 叶 变 换 (FFT) 
的 快速 、 有 效 的 数值 方法 ， 使 特别 长 的 时 间 序 列 的 相关 计算 变 得 可 行 .” 

图 表 13-3 BAH 13-2 里 时 间 序 列 的 周期 图 ， 图 中 的 高 峰 清 晰 显示 了 两 个 余弦 - 正 强 分 量 


的 存在 及 相对 强度 ， 还 能 注意 到 频率 轴 上 已 标示 出 频率 4/96 ~ 0. 041 67 和 14/96 = 
0. 145 83. | 


O ”经常 星 基 于 Cooley-Tukey FFT 算法 ; 见 Gentleman 和 Sandet 1966). 
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图 表 13-3 BR 13-2 中 序列 的 周期 图 


0.0 0.041 67 0.1 0.14583 0.2 0.3 0.4 0.5 
频率 


> periodogram(y); abline(h=0); axis(1,at=c(0.04167, .14583) ) 


当 不 知道 序列 中 的 余弦 何在 ， 甚 或 余弦 存在 性 都 未 知 时 ， 周 期 图 是 否 仍然 可 用 呢 ? 序列 如 
果 含 附加 “噪声 ” 呢 ? 为 说 明 起 见 ， 我 们 随机 选取 频率 、 振 幅 、 相 位 ， 并 附加 加 性 白 噪声 ， 产 
生 一 个 时 间 序 列 . 从 1/96,2/96,*……: ,47/96 中 不 重复 地 随机 选取 两 个 频率 ，A、B 的 数值 则 独 
立地 取 自 均值 为 0， 标 准 差分 别 为 2 和 3 的 正 态 分 布 ， 最 后 ， 加 上 一 个 与 A、B 独立 的 正 态 白 
噪声 {W,}， 其 均值 为 0， 标 准 差 为 1， 模 型 如 下 9 : 
Y, = A cos(2n fit) + Bisin(2rxf1t) + Azcos(2r f:t) + Bzsin(2xf,t) +W, (13.2.4) 
图 表 13-4 显示 了 一 个 模拟 此 模型 的 长 度 为 96 的 时 间 序 列 ， 我 们 再 次 看 到 ， 不 明显 的 周期 性 在 
图 表 13-5 中 显露 出 来 . 
图 表 13-4 ” 带 “ 隐 藏 ”周期 性 的 时 间 序 列 


win.graph (width=4.875,height=2.5,pointsize=8) 

set.seed(134); t=1:96; integer=sample (48, 2) 

freql=integer [1] /96; freq2=integer [2] /96 

Al=rnorm(1,0,2); Bl=rnorm(1,0,2) 

A2=rnorm(1,0,3); B2=rnorm(1,0,3); w=2*pi*t 

y=Al*cos (w*freq1) +B1*sin (w*freql) +A2*cos (w*freq2) + 
B2*sin(w*freq2) +rnorm(96,0,1) 

> plot (t,y, type='0', ylab=expression(y[t])) 


V VV VV 


怠 ” 这 一 模型 常 被 称 为 信号 加 嗓 声 的 模型 ， 信 号 既 可 能 是 确定 性 的 〈 参 数 未 知 ) ， 也 可 能 是 随机 的 . 
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图 表 13-5 R 13-4 中 时 间 序 列 的 周期 图 


0.0 0.1 0.2 0.3 0.4 0.5 
> periodogram(y) ;abline (h=0) 


该 周期 图 明确 显示 出 ， 约 在 0. 11 和 0. 32 MPMBL, KFNATATRK-ERM, A 
频 分 量 信号 很 强 . 周期 图 里 还 有 其 他 若干 幅度 很 小 的 尖峰 ， 显 然 是 由 于 加 性 白 噪 声 分 量 的 存在 
PR. 〈 当 详细 检查 该 模拟 时 ， 我 们 发 现 其 中 一 个 频率 选择 的 是 10/96 汪 0. 1042， 而 另 一 个 选 
为 30/96 一 0. 3125. ) 

这 里 有 个 来 自 Whittaker 和 Robinson(1924) 的 经 典 时 间 序 列 周期 图 的 示例 .图 表 13-6 绘 
出 了 某 颗 恒星 在 600 个 连续 夜晚 的 午夜 亮度 〈 等 级 ) 时 间 序 列 图 


图 表 13-6 ”600 个 连续 夜晚 恒星 的 亮度 变化 


> Gata (star) 
> plot (star,xlab='Day',ylab='Brightness' ) 


图 表 13-7 显示 了 该 时 间 序 列 的 周期 图 ， 其 中 有 两 个 显著 的 尖峰 . 当 考 察 真实 数值 时 ， 我 
们 发 现 更 高 的 尖峰 位 于 频率 f= 21/600=0. 035 上 ， 对 应 于 周期 600/21A28. 57， 或 者 说 接近 
29 R. 第 二 位 的 尖峰 位 于 频率 f~25/600~0. 041 67 上 ， 对 应 于 一 个 24 天 的 周期 ， 那 些 在 主 
尖峰 附近 非 零 的 周期 图 数值 可 能 是 泄露 引起 的 . 
两 个 尖峰 提示 了 该 序列 的 模型 具有 频率 或 周期 适当 的 两 个 余弦 -正弦 对 ， 即 
Y, = & tfrcos(2xfit) 十 房 sin(2r it) + Bcos(2xfrt) + &sin(2n fet) te (13. 2. 5) 
其 中 有 =1/29，f; 二 1/24， 像 第 3 章 中 那样 ， 如 果 对 该 回归 模型 所 有 5 个 参数 进行 估计 ， 我 们 


© Bloomfield(2000) 中 给 出 了 此 序列 的 全 面 分 析 . 
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能 够 得 到 统计 显著 的 回归 系数 ， 多 重 R 方 的 值 为 99. 9%. 
在 14. 5 节 中 ， 我 们 还 会 见 到 这 个 时 间 序 列 ， 并 以 之 讨论 泄露 和 锥 前 问题 . 


图 表 13-7 ”恒星 亮度 变化 时 间 序 列 的 周期 图 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


> periodogram(star,ylab='Variable Star Periodogram') ;abline (h=0) 


虽然 傅 里 叶 频 率 有 特殊 性 ， 但 我 们 可 以 在 方程 (13. 1. 8) 和 方程 (13.2.1) 中 将 周期 图 的 
概念 拓展 到 0 到 1/2 区 间 上 所 有 的 频率 ， 从 而 对 于 0 硅 f 硅 1/2， 得 到 


I (13. 2. 6) 
其 中 ， 


Ñ, 


Â, = Ž SY cost2ntf) f È= Z D Yesinntf) (13. 2. 7) 


MAER, RR A Ee 1 BS EAI, ARBOE BET a 
的 点 就 显示 了 一 条 大 致 光滑 的 曲线 ， 

那 为 什么 只 考虑 频率 为 正 的 情况 呢 ? 因为 根据 余弦 和 正弦 奇偶 性 的 性 质 ， 任 何 具 有 负 频 率 
(比方 说 一 了 ) 的 余弦 - 正 芝 曲 线 均 可 以 由 具有 频率 十 了 的 余弦 -正弦 曲线 很 好 地 表示 出 来 ， 所 以 
使 用 正 值 的 频率 不 会 失掉 一 般 性 .” 

第 二 ， 为 什么 把 频率 限定 在 0 到 1/2 区 间 上 ? 考虑 图 表 13-8 中 的 图 形 ， 这 里 绘 出 了 两 条 余 


图 表 13-8 ” 假 频 的 图 解 


A 
i 
i i 
| i 


离散 时 间 : 


O AH 03.2.6) 的 定义 常用 于 一 1/2 一 A 一 二 1/2， 但 所 得 函数 关于 零点 对 称 ， 且 负 频 率 不 提供 更 多 的 新 信息 - 我 们 
将 在 本 章 稍 后 部 分 同时 使 用 正 的 和 负 的 频率 以 导出 优美 的 数学 关系 . 
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(8%) 


V 


win.graph(width=4.875, height=2.5,pointsize=8) 

t=seq(0,8,by=.05) 

plot (t,cos(2*pi*t/4) ,axes=F,type='1l',ylab=expression(Y[t]), 
xlab='Discrete Time t') 

axis(1,at=c(1,2,3,4,5,6,7));axis(1); axis(2); box() 

lines (t,cos(2*pi*t*3/4),lty='dashed',type='1'); abline(h=0) 
points (x=c(0:8) ,y=cos(2*pi*c(0:8)/4) ,pch=19) 


v v 


v v 


v 


弦 曲 线 ， 一 条 频率 为 f 一 1/4， 另 一 条 由 虚线 所 绘 的 频率 为 [一 3/4. 若 只 在 离散 时 间 点 0,1,2， 
3,…， 上 观察 序列 ， 则 无 法 区 分 两 条 曲线 ， 我们 称 两 个 频率 1/4 与 3/4 HARA. 一 般 而 言 ， 
对 每 个 正 整数 &，0 到 1/2 区 间 上 的 每 一 频率 与 形 如 f 十 k(1/2) 的 频率 互 为 假 频 ， 因 此 只 关注 
0 到 1/2 区 间 上 的 频率 就 足够 了 . 


13.3 谱 表 示 和 谐 分 布 
考虑 一 个 如 下 表示 的 时 间 序 列 : 
= DA cos(2nf,t) + B;sin(2xf;t) | (1% 9.4) 


其 中 ， 频 率 0 志方 一 户 一 … .一 太一 172 固定 ，A;，B; 为 独立 正 态 随机 变量 ， 其 均值 为 零 ，Var 
(Ai)= 王 Var( 了 Bi) 一 过， 直接 计算 得 到 {Y,》 为 零 均值 平稳 的 >， 且 


| = Deeos(2nkf,) (13. 3. 2) 
特别 地 ， 过 程 的 方差 v a E 
= Xa (13. 3. 3) 
若 对 O<f<1/2, 定义 如 下 两 个 阶梯 函数 
afi= DA, K= > B; (13. 3. 4) 
GLEN GGSN 


则 可 将 方程 (13.3.1) 写成 
/2 
Y,= f cost2a fida f) +Í sin(2x ft) dbCf) (13. 3.5) 
0 0 


事实 上 ， 任 何 零 均值 平稳 过 程 都 能 表示 成 方程 (13. 3. 5 的 形式 . 它 说 明了 平稳 过 程 是 如 何 
用 连续 频带 上 的 无 穷 多 个 余弦 -正弦 对 的 线性 组 合 表示 出 来 的 . 一般 而 言 ，a(f) 和 6b(f) 是 以 
0<f<1/2 上 的 频率 为 自 变量 的 零 均 值 随机 过 程 ， 其 各 自 的 增 量 不 相关 *， 并 且 a(/) 的 增 量 
与 b(f) 的 增 量 也 不 相关 .进一步 地 有 


Var( | da(f)) = var(| dof) = Fa) — FD (13. 3. 6) 


将 此 与 习题 2. 29 进行 比较 . 
该 证 明 超出 了 本 书 范畴 ， 可 见于 Cramér 和 Leadbetter(1967, 128— 138 页 )， 不 了 解 随机 Riemann-Stieltjes 积分 ， 


不 会 影响 对 后 续 谱 分 析 讨 论 的 正确 理解 ， 
© ”不 相关 增 基 通常 也 称 为 正 交 增 基 ， 


OO 
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方程 13.3.5) 称 作 过 程 的 谱 表 示 . 定义 在 Oo 过 FI1/2 上 的 非 降 函 数 F(f) 称 作 过 程 的 谱 分 布 函数 . 
由 方程 (13.3.1) 定义 的 特殊 过 程 有 纯 离 散 的 谱 (或 称 线 谱 )， 对 于 0 三 f 夺 1/2， 
F(f)= X d (13. 3. 7) 


GIEN 


这 里 谱 分 布 上 跳跃 的 高 度 显示 了 不 同 周期 分 量 对 应 的 方差 ， 跳跃 的 位 置 则 表明 了 周期 分 量 的 
频率 . 

F 是非 降 的 

F 是 右 连 续 的 

FAA >0 ,对 所 有 f 

jim FC) = Var(Y,) = % 


(13. 3. 8) 


e U N 


如 果 考 虑 标 度 化 的 谱 分 布 函数 F(f)/Y。， 由 于 F(1/2)/Y。 二 1， 我 们 就 得 到 了 一 个 与 0 到 1/2 区 
间 上 随机 变量 的 累积 分 布 函数 (CDF) 具有 相同 数学 特性 的 函数 . 
谱 分 布 还 可 作 如 下 解读 : 对 于 0 三 用 二 fi 三 1/2， 积 分 
Ie dF(f) (13. 3. 9) 


给 出 了 OB) eH FA/D=y 中 对 应 于 f 到 fe 之 间 的 那个 部 分 . 

样本 谱 密 度 

在 谱 分 析 中 ， 习 惯 上 首先 要 从 序列 中 移 去 样本 均值 .本章 接 下 来 的 叙述 中 ， 约 定 在 周期 图 
定义 里 ，Y, 表示 到 其 样本 均值 的 偏差 . 进一步 地 ， 为 数学 上 处 理 方便 起 见 ， 将 像 周 期 图 那样 
的 各 种 频率 函数 定义 于 区 间 (—1/2, 1/2] E. 特别 地 ， 对 (一 1/2，1/2) 上 的 频率 ， 定 义 样 
本 谱 密 度 或 样本 谱 为 SC 六 =1/2I(P) ， 且 S(1/2)=IG1/2)， 经 过 直接 但 繁琐 的 代数 运算 ， 可 以 
证 明 样 本 谱 密 度 也 有 如 下 表达 式 : 


SCA) = % +25) ¥,cos(2n fk) | (13. 3. 10) 
其 中 六 Ata k iii ERK, 给 出 表达 式 如 下 ， 
= 一 >> (Y, —Y) (Ym — Y) (13. 3. 11) 


t= k41 


DE FA E E HAAT ES >» PEA wR EBD PEAK DIN KE (离散 时 间 ) MEH ARR. HR GEE 
里 时分 析 理论 ， 必 存在 一 个 相反 的 关系 ， 即 2 


n= | S(focos(2n fk) df C13" SD 
特别 地 ， 样 本 谱 密 度 下 方 的 整个 区 域 恰 是 时 间 序 列 的 样本 方差 . 
=, Spa = LH, -YY (13. 3. 13) 


因为 双方 可 以 互相 推导 ， 所 以 对 于 所 观测 的 时 间 序 列 而 言 ， 样 本 谱 密度 与 样本 协 方差 函数 含有 


加” 该 结论 可 用 附录 所 述 的 正 交 关系 予以 证 明 , 
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相同 的 信息 ， 仅 是 表达 方式 不 同 而 已 ， 可 以 分 别 方便 地 适用 于 不 同 的 目的 . 


13.4 Bee 


很 多 过 程 ， 比 如 所 有 的 平稳 ARMA 过 程 ， 其 协 方差 函数 随 着 滞后 阶 数 的 增长 而 快速 大 
减 .在 这 种 情况 下 ， 用 方程 (13.3.10) 的 样本 谱 密度 相应 的 理论 值 替 换 样本 值 的 考虑 是 顺 理 
成 章 的 ， 准 确 地 说 ， 若 协 方差 函数 7 是 绝对 可 加 的 ， 则 对 于 一 1/2 一 FIL/2， 可 定义 理论 (或 
总 体 ) 谱 密 度 为 


SC(F) = % +23) ncos(2nfk) (13.4.1) 
同样 ， 存 在 一 个 相反 的 关系 ， 由 下 式 给 出 : 
六 一 | SC feos(2nfedf (13. 4. 2) 


从 数学 上 来 说 ， SCf) 是 序列 …， Y-2s ¥-12 Yoo yi zy， … 的 (离散 时 间 ) e EHEM, 而 
{ 为 》 是 定义 在 一 1/2 一 f<1/2 上 的 谱 密 度 S(f) AY OP ERS. 
除 全 部 区 域 为 y 而 不 是 1 以 外 ， 谱 密度 具有 (一 1/2，1/2] 上 概率 密度 函数 的 所 有 数学 
性 质 ， 且 可 以 证 明 
F(f = | SGz)dz ， o<f<i/2 (13. 4. 3) 


因此 ， 在 频率 fi 和 f Zh, FOSAS, EE TF R A E aE 
程 方差 中 对 应 于 频率 区 间 上 构成 该 过 程 之 余弦 -正弦 对 的 那个 部 分 . 

时 不 变 线性 滤波 器 

时 不 变 线 性 滤波 器 是 由 一 个 绝对 可 加 常数 序列 …，c_1，co，cl，cs，c3，… 来 定义 的 ， 若 
(X) 为 一 个 时 间 序 列 ， 使 用 上 述 常 数 对 (X) 进行 滤波 后 ， 生 成 一 个 新 的 时 间 序 列 {Y,}， 
表示 如 下 : 


oo 


Y, = JYX (13. 4. 4) 


 =—00 


若 对 上 二 0， 有 c 一 0， 则 称 该 滤波 器 为 因果 的 ， 这 种 情况 下 ， 在 时 刻 上 的 滤波 仅 涉 及 当前 及 过 
去 的 数据 取 值 ， 且 能 够 “实时 ”地 进行 . 

在 前 述 章节 里 ， 我 们 已 经 碰 到 过 很 多 时 不 变 线性 滤波 器 的 例子 ， 例 如 〈 非 季节 或 季节 ) 差 
分 由 一 个 季节 差分 和 一 个 非 季 节 差 分 构成 的 组 合 是 另外 的 例子 .任何 滑动 平均 过 程 都 可 看 成 是 
对 白 噪声 序列 的 一 个 线性 滤波 ， 事 实 上 ， 每 个 由 方程 〈4. 1. 1) 定义 和 的 一 般 线性 过 程 都 是 对 日 


O GR. HHE (13. 2. 4) 和 方程 (13. 3. 1) 所 定义 的 过 程 不 属 此 种 情况 ， 其 谱 中 含有 离散 分 量 ， 
© 注意 到 为 =- ， 并 且 余 弦 函 数 是 偶 上 数 ， 有 


sip = D nett 
| 一 Do 
其 中 i= v 一 1 是 复数 的 虚数 单位 ， 上 式 看 上 去 更 像 一 个 标准 的 离散 时 间 傅 里 时 变换 . 同样， 方程 13.4.2) 可 以 写 
Bn = 三 Semas. 


噪声 的 一 个 线性 滤波 . 

方程 (13. 4. 4) 右 侧 表达 式 常 被 称 作 两 个 序列 (a) 和 LX.) 的 (离散 时 间 ) ae. 时间 
域 上 复杂 的 卷 积 运算 经 健 里 叶 变换 后 成 为 了 频率 域 上 非常 简单 的 乘法 运算 ， 这 正 是 傅 里 时 变换 
的 一 个 极其 有 用 的 性 质 .9 

特别 地 ， 令 Sx(f) 为 过 程 (X) 的 谱 密 度 ，Sy(f) 为 过 程 {Y,} 的 谱 密 度 ， 并 且 令 


Cle) = SV ce (13. 4.5) 
则 
Cov(Y,,Y-.) = Cov >) cX, 1 ek, e-s) = D Dev. Covex., > ore 
一 > > ce. Fete IIS. fdf = | | 3 c,e 2 ASCP) df 
所 以 C o i 
Cov Yma) = |" 1 CE liSr eaf (13. 4. 6) 
而 
Cov(¥, ,¥-4) = | sr endf (13.4.7) 
故 必 然 有 
Sy(f) =| Cle) | SECA) (13. 4. 8) 


这 个 表达 式 对 于 考察 时 不 变 线性 滤波 器 在 谱 上 的 效果 极 具 价值 .特别 是 ， 它 有 助 于 找到 AR- 
MA 过 程 谱 密度 的 形式 ， 函 数 | Cleo) | 也 常 被 称 作 滤 波 器 的 《功率 ) 转移 函数 . 


13.5 ARMA 过 程 的 谱 密度 


ARA 
从 方程 3.4.1) 易 见 ， 白 噪声 过 程 在 一 1/2 二 f 志 1/2 上 ， 其 理论 上 的 谱 密度 为 常数 ， 特 别 地 ， 
SCP =6 (13. 5. 1) 
白 噪声 的 谱 表 示 里 所 有 的 频率 权重 相同 ， 这 一 点 与 物理 上 白光 的 谱 可 直接 类 比 一 一 所 有 色彩 
( 即 所 有 的 频率 ) 平等 地 组 成 白光 ， 这 也 正 是 白 噪声 名 称 的 由 来 ! 
MA(1) 的 谱 密度 
一 个 MA(1) 过 程 是 c==1 和 c= 一 2 时 白 噪声 的 一 个 简单 的 滤波 ， 所 以 
| Ce") |= (1— 6) (1 — de ™™) 
=1+¢—-—@e'’™ +e") 
=14+6 — 26cos(2xf) (13. 5. 2) 


一 


日 ”在 讨论 矩 生成 沙 数 的 时 候 ， 读 者 可 能 已 经 见 过 这 一 处 理 方式 了 ， 两 个 独立 随机 变 最 和 的 密度 ， 无 论 是 离 敬 的 还 是 连 
续 的 ， 都 是 各 自 密 度 的 卷 积 ， 而 和 的 和 矩 生成 函数 恰 是 其 各 自 矩 生成 郴 数 的 乘积 , ， 
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因而 有 
sD = L1+& — 26cos(2xrf) lo (13. 5. 3) 
可 以 证 明 ， 当 人 0 时 ， 谱 密度 是 非 负 频率 上 的 增 图 数 ， 而 当 econ, WW yk we. 
图 表 13-9 显示 了 当 050.9 MAC) 过 程 的 谱 密度 .因为 谱 密度 关于 频率 原点 对 称 ， 
所 以 只 需 绘 出 其 频率 为 正 的 部 分 即 可 . 前面 讲 过 MA(1) 过 程 在 滞后 1 处 会 有 一 个 相对 大 的 
负 相 关 值 ， 而 所 有 其 他 相关 值 为 零 ， 这 个 情况 也 反映 在 谱 上 . 可 以 看 到 密度 在 高 频 部 分 明显 
强 于 低频 部 分 ， 过程 在 其 均值 水 平 上 有 来 回 振 葛 的 趋势 ， 而 快速 振 划 正 是 高 频 部 分 的 特性 . 
可 以 说 ， 滑 动 平均 抑制 了 白 噪 声 的 低频 分 量 . 由 于 这 类 频谱 强调 高 频 部 分 ( 即 有 较 小 周期 或 
波长 的 部 分 ) 的 作用 ， 高 频 部 分 在 可 见 光 的 频谱 上 对 应 蓝 色 光 ， 所 以 有 时 研究 者 也 称 其 为 
蓝 谱 ， 
图 表 13-9 8=0.9 时 MA(1) 过 程 的 谱 密度 


WEE 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


> win.graph (width=4.875, height=2.5,pointsize=8) 
> theta=.9 # Reset theta for other MA(1) plots 
> ARMAspec (model=list (ma=-theta) ) 


图 表 13-10 显示 当 0 一 一 0.9 时 MA(1) 过 程 的 谱 密度 ， 过程 在 滞后 1 处 有 正 相 关 值 ， 所 有 
其 他 相关 值 为 零 ， 该 过 程 从 一 个 时 刻 到 下 一 时 刻 有 慢 变 趋势 ， 这 是 低频 特性 并 有 反映 在 频谱 形状 
上 . 密度 的 低频 部 分 明显 强 于 高 频 部 分 ， 研究 者 有 时 称 这 样 的 频谱 为 红 谱 . 
图 表 13-10 64= 一 0.9 时 MA(1) 过 程 的 谱 密 度 


O ”在 本 节 后 面 所 有 ARMA 谱 密度 的 图 里 ， 都 取 只 一 1. 这 样 做 仅 对 图 形 的 纵 坐 标 有 影响 ， 不 会 影响 图 的 形状 . 


MA(2) 的 谱 密 度 
类 似 可 得 MA(2) 模型 的 谱 密 度 . 经 稍 长 代数 运算 ， 得 出 最 后 的 表达 式 如 下 : 
SiD =[1+6 + 4 — 24,01 — @)cos(2nf> — 20 cos(4nrf) Je? (13. 5. 4) 


图 表 13-1] 展示 了 密度 在 9, 一 1，6, 一 一 0.6 时 的 图 在 0.1 到 0. 18 之 间 的 频率 上 密度 值 特别 
小 ， 而 在 低 于 0. 1 的 频率 上 ， 密 度 值 极 小 ， 图 中 较 高 的 频率 逐渐 进入 视野 ， 最 强 的 周期 分 量 出 
现在 最 高 频率 上 . 


图 表 13-11 6,=1，6: = 一 0.6 时 MA(2) 过 程 的 谱 密度 


0.0 0.1 0.2 0.3 0.4 0.5 


> thetal=1; thetaz=-0.6 
> ARMAspec (model=list (ma=-c(thetal, theta2) ) ) 


SG a a eR ae a 
AR(1) Ria E 
这 里 使 用 方程 03.4.8) 的 “后 向 ”形式 求 AR 模型 的 谱 密 度 ， 即 将 白 噪声 过 程 看 做 AR 
过 程 的 一 个 线性 滤波 .回顾 前 述 MAC) 序列 的 谱 密 度 ， 有 
[l1+¢# — 2¢cos(2nf) ISC A) = o (13.5.5) 
求解 得 到 


SC = 人 
1+ ¢*° — 2¢cos(2nf) 
如 下 面 两 图 所 示 ， 该 谱 密 度 在 o> 时 为 频率 的 减 函 数 ， 而 在 $< 二 0 时 为 增 函 数 ， 
图 表 13-12 由 =09 时 AR(1) 过 程 的 谱 密度 


(13. 5. 6) 


> phi=0.9 # Reset value of phi for other AR(1) models 
> ARMAspec (model=list (ar=phi1) } 
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EE 13-13 ¢=—-O0O.6RAR(1) 过 程 的 说 密度 


WPS 
D = N bo fe Un oh 


AR(2) 的 谱 密度 
对 于 AR(2) 的 谱 密度 ， 再 次 使 用 方程 (13. 4. 8) 的 后 向 形式 以 及 MAC) 的 结果 ， 得 到 


A a r e a a ee ae a i : Ded 
SU) 14+ 43 +E — 2A (1 — ¢,)cos(2nf) — 2f cos(4nf) orn 


正如 相关 性 一 样 ，AR(2) 模型 的 谱 密度 能 够 显示 出 各 种 不 同 的 性 质 ， 这 些 取决 于 两 个 参数 


的 具体 取 值 . 
图 表 13-14 和 图 表 13-15 显示 了 两 个 AR(2) 谱 密 度 的 显著 差异 ， 一 个 状 如 高 峰 ， 而 为 一 


个 则 形 如 低谷 ， 
图 表 13-14 AR(2) 过 程 的 谱 密 度 ; ¢,=1.5, ¢=-0.75 


频率 


> philel.S; phi2=-.75 
> # Reset values of phil & phi2 for other AR(2) models 
> ARMAspec (model=list (ar=c (phil, phi2) ) ) 


图 表 13-15 AR(2) HERRER: $, =0. 1, $2=0.4 


Jenkins 和 Watts(1968, 229 页 ) 指出 ，AR(2) 谱 的 不 同形 状 由 下 面 的 不 等 式 决 定 ， 
1¢(1—#) |< Ag | (13. 5. 8) 
图 表 13-16 中 所 示 的 是 相应 结果 最 好 的 概括 ， 图 中 虚线 是 ARD 特征 方程 实 根 与 虚 根 区 域 的 边 
界 ， 实 线 曲 线 则 由 方程 《13. 5. 8) 中 的 个 图 表 13-16 AR(2) 生成 不 同形 状 谐 密度 曲线 的 参数 全 
等 式 确 定 . $$ uuo 
注意 Jenkins Al Watts |e) Ay i FR iL. 
峰 兴 出现 的 频率 f, 满足 下 式 : 


一 
cos(2xf,) = ree 


(13. 5. 9) 
一 般 认为 复 根 对 应 一 个 高 峰 状 的 频谱 ， 但 
是 要 注意 参数 取 值 上 存在 一 个 小 区 域 ， 当 
取 值 于 该 区 域 时 ， 根 为 复数 ， 而 谱 中 没有 
高 峰 ， 其 所 在 频率 既 不 高 也 不 低 . 
ARMA(1, 1) 的 谱 密 度 
结合 MAC) 和 AR(1) 模型 所 知 ， 可 以 很 容易 地 得 到 ARMA(1，1) 混合 模型 的 谱 密 度 : 


_ 1+ — 26@cos(2nf) a 
S(f) T+ # — 2¢cos(2n N” (13. 5:10) 


图 表 13-17 ET 4 ¢=0.5, 0=0.8 Rt ARMAC, 1) 的 谱 的 例子 . 
图 表 13-17 ARMA(1, 1) HWER, ¢=0.5, 90=0.8 


0.0 0.1 0.2 0.3 0.4 0.5 


> phi=0.5; theta=0.8 
> ARMAspec (model=list (ar=phi,mas-theta) ) 


ARMA(?, q) 
对 于 一 般 ARMA(p, g) 的 情形 ， 谱 密度 可 以 用 AR 和 MA 的 特征 多 项 式 表 达 如 下 : 
ae 2") |? , 
SCP = | ary | % ae NS 


还 可 进一步 用 这 些 多 项 式 根 的 倒数 来 表示 ， 这 里 不 再 给 出 . 此 类 谱 密 度 常 被 称 作 有 理 谱 密度 
季节 ARMA 过 程 
由 于 季节 ARMA 过 程 是 特殊 的 ARMA 过 程 ， 故 所 有 前 述 结论 这 里 都 成 立 . 乘法 季节 模 
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型 可 视 为 连续 两 个 线性 滤波 器 的 应 用 ， 下 面 给 出 两 个 例子 . 


考虑 由 季节 AR 模型 定义 的 过 程 
(1 — $B) (1 — ØB”? )Y, = e, (13.5.12) 
分 别 调整 两 个 因子 得 到 
SCF) = e a a (13. 5. 13) 


[1 +g — 2¢cos(2xf) L1 + Ø — 2Øcos(2xr12f)] 
Hy ea i A AATA 13-18, Ff $=0.5, p=0.9, s=12. Æ 0, 1/12, 2/12, 3/12, 
4/12, 5/12 和 6/12 FHKE, GBM MAS RI wR TEHE. 
作为 第 二 个 例子 ， 考 虑 季节 MATE 
Y, = (1— 6B)(1 — 6B" de, (13. 5. 14) 

相应 的 谱 密度 由 下 式 给 出 : 

S(f) = [1 +Ë -- 26cos(2xf) J[1 +8 — 28cos(2r127f) Jo? (13. 5. 15) 
图 表 13-19 示 出 了 参数 取 值 0=0. 4, O=0. 9 时 的 谱 密 度 . 


图 表 13-18 季节 AR 的 谱 密 度 , $=0.5, @=0.9,， s=12 


400 
0 
200 
a 
100 
0 = 一 一 -一 
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频率 


> phi=.5; PHI=.9 
> ARMAspec (model=list (ar=phi, seasonal=list (sar=PHI , period=12) ) ) 


图 表 13-19 ERES $=0.4, @=0.9, s= 12 


aa 


频率 


HE HE 
DOD -NUAN 


> theta=.4; Theta=.9 
> ARMAspec (model=list (ma=-theta, seasonal=list (sma=-Theta, 
period=12) ) ) 


13.6 样本 谱 密 度 的 抽样 性 质 
我 们 从 考虑 已 知性 质 的 时 间 序 列 开始 本 节 介 绍 ， 假 设 要 模拟 一 个 AR(1)》 模型 ， 其 中 % 一 一 0.6， 


步 长 n= 200, BHX 13-13 显示 了 该 序列 的 理论 谱 密 度 . 模拟 序列 的 样本 谱 密 度 示 于 图 表 13-20， 平 滑 
的 理论 谱 密 度 由 虚线 示 出 ， 即 便 样本 容量 达 200， 样 本 谱 密 度 在 不 同 频 点 上 仍然 变化 极 大 ， 这 肯定 
不 是 该 过 程 理论 谱 可 接受 的 估计 ， 这 里 有 必要 对 样本 谱 密 度 的 采样 特性 进行 研究 ， 以 帮助 我 们 理解 
所 看 到 的 现象 . 

为 研究 样本 谱 密 度 的 采样 性 质 ， 我 们 先 从 简单 情况 入手 、 考 察 零 均值 、 方 差 为 yo WES 
AIREA AITA (Y). 回顾 


A; = Dy Yicos2ntf) B, = $ resin ath) (13. 6. 1) 


现在 ， 仅 考虑 非 零 傅 里 叶 频 率 f=j/n 二 1/2， 由 于 A SB, 为 时 间 序 列 {Y,} 的 线性 函数 ， 
每 个 都 有 一 个 正 态 分 布 ， 因 此 可 以 用 余弦 及 正弦 的 正 交 性 质 对 均值 和 方差 进行 评估 .我 们 发 
WA, AB, 各 有 均值 零 及 方差 2ym/m。 利 用 正 交 性 也 能 证 明 A 5B, 无 关 ， 又 因为 它们 为 联合 
双 变 量 正 态 分 布 ， 所 以 它们 相互 独立 ,类似 地 ， 可 以 证 明 对 任意 两 个 不 同 的 傅 里 叶 频 率 A 和 
fas Ay» Ap» By, AB, 是 联合 独立 的 . 
图 表 13-20 ”模拟 ARI) 过 程 的 样本 谱 密度 


| 


0.2 0.3 (4 


0.0 0.1 0.5 
频率 


win.graph (width=4.875,height=2.5,pointsize=8) 
set, seed (271435); n=200; phi=-0.6 
y=arima.sim(model=list (ar=phi) ,n=n) 
spespec (y, log='no',xlab='Frequency', 

ylab='Sample Spectral Density',sub='') 
> lines (sp$freq, ARMAspec (model=list (ar=phi) , freq=sp$freq, 
plot=F)$spec,lty='dotted'); abline (h=0) 


VO vV VW WV 


此 外 我 们 知道 ， 标 准 正 态 的 平方 的 分 布 是 有 一 个 自由 度 的 卡 方 分 布 ， 而 独立 卡 方 变量 之 和 
的 分 布 仍 为 卡 方 分 布 ， 其 自由 度 为 所 有 自由 度 相 加 的 值 ， 由 于 SAOS. i 
[A + (B,)*] = Er 


S( J) 
的 分 布 为 有 两 个 自由 度 的 卡 方 分 布 . 
前 面 提 到 卡 方 变量 的 均值 等 于 其 自由 度 的 值 ， 方 差 等 于 其 自由 度 的 值 的 两 倍 ， 鉴 于 此 ， 可 
以 很 快 发 现 


(13, 6. 2) 


Y fi Æ fe SCAO MÄ) 相互 独立 ， 《13. 6. 3) 


Ə MER J. 
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EL[LS$(f)] = SP) (13. 6. 4) 
H . 
Var[$(f)] = Sf) (13. 6. 5) 
方程 (13.6.4) 指出 了 一 个 理想 的 事实 ， 即 样本 谱 密 度 是 理论 谱 密 度 的 无 偏 估计 . 

遗憾 的 是 ， 方 程 (13. 6. 5) 显示 了 方差 丝毫 都 不 依赖 于 样本 量 n 即便 从 这 个 简单 的 例子 
来 看 ， 样 本 谱 密 度 都 不 是 理论 谱 密度 的 一 致 估计 . 因此 估计 不 会 随 样 本 量 的 增长 而 更 好 〈 即 有 
更 小 的 方差 );， 样 本 谱 密度 是 不 一 致 估计 的 原因 基本 上 是 : 即便 仅 考 虑 傅 里 叶 频 率 1/n,2/n,…， 
也 要 估计 越 来 越 多 的 “参数 ”， 即 S(1/n)，S(2/n)，…。， 对 于 每 个 参数 而 言 ， 样 本 量 的 增长 也 不 
会 有 足够 多 的 数据 点 以 生成 一 致 估计 . 

事实 上 方程 (13.6.3) ~ (13.6.5) 中 的 结论 在 更 一 般 的 意义 上 都 成 立 ， 在 习题 里 ， 将 要 求 
读者 论证 对 于 任意 白 噪声 一 一 不 必 为 正 态 的 一 一 均值 的 结论 的 确 成 立 ， 且 构造 S( 户 ) RS (fr) 
MA, MB, EVE AAf: 时 无 关 . 

为 叙述 更 一 般 的 结论 ， 设 {Y,) 为 任意 线性 过 程 

Y, = e, + piem + prem + (13.6.6) 

式 中 各 e 独立 同 分 布 ， 均 值 为 零 ， 方 差 相 等 RMA y RATM, + AAS. H OF) 1/2 
上 的 任意 频率 ， 则 可 证 明 S 当 样 本 量 无 限 增加 时 ， 


人 
SC SG) (13. 6. 7) 


依 分 布 收敛 到 独立 卡 方 分 布 的 随机 变量 ， 且 均 为 两 个 自由 度 . 

为 研究 基于 方程 (13. 6.7)、(13. 6.4) 和 (13.6.5) 之 逼近 的 可 用 性 ， 下 面 用 两 个 模拟 展 
示 相 关 结 果 . 首先 对 一 个 9=0.9 的 MAC) 时 间 序 列 ， 重 复 模拟 1000 次 ， 每 次 的 长 度 n=48. 
用 于 生成 MA(1) 序列 的 白 噪 声 序列 独立 地 选 自 一 个 有 5 个 自由 度 、 归 一 化 到 单位 方差 的 上 分 
布 ， 从 这 1000 个 序列 计算 1000 个 样本 谱 密 度 . 

图 表 13-21 示 出 了 对 应 n=48 的 24 个 傅 里 叶 频 率 上 的 1000 个 样本 谱 密 度 的 平均 估 值 . 实 
线 为 理论 谱 密 度 ， 显 然 这 里 的 样本 谱 密 度 是 个 可 用 的 无 偏 逼 近 . 


图 表 13-21 平均 样本 谱 密 度 : MH MA(1), G=0.9, n=48 


平均 谱 密度 估计 
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For the extensive R code to produce Exhibits 13.21 through 13.26, 
please see the Chapter 13 script file associated with this book. 


日 ”例如 见 Fuller(1996, 360—361) . 
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图 表 13-22 画 出 了 1000 次 重复 模拟 的 样本 谱 密 度 的 标准 益 ， 根 据 方 程 (13. 6.5)， 我 们 希 


望 其 与 理论 谱 密 度 在 傅 里 叶 频 率 上 相 吻 合 ， 有 逼近 再 次 显示 出 相当 好 的 可 接受 性 , 


图 表 13-22 样本 谱 密 度 的 标准 差 : 模拟 MA), 6=0.9, n=48 


ps o So 
= 2 ; 
£ 
= ] 
a 
ai EE 

0.1 0.2 0.3 0.4 

频率 


为 检查 样本 谱 密 度 分 布 的 形状 ， 构 造 一 个 QQ 图 来 比较 观测 到 的 分 位 数 与 有 两 个 自由 度 的 
卡 方 分 布 的 差别 ， 当 然 ， 可 以 在 任意 的 傅 里 叶 频 率 上 这 样 做 ， 图 表 13-23 显示 了 在 频率 15/748 
上 的 结果 ， 其 与 卡 方 分 布 的 一 致 程度 是 可 接受 的 . 
当 模 型 为 一 个 内 一 1.5， 上 一 一 0.75 H n= 二 96 的 AR(2) 时 ， 重 复 进行 类 似 的 画图 与 计算 .这 
里 使 用 正 态 白 噪 声 ， 结 果 示 于 图 表 13-24、13-25 和 13-26 中 . 对 于 n=96, 1000 次 重复 的 模拟 结 
果 再 一 次 显示 了 与 极限 理论 的 结论 显 若 相 符 . 


图 表 13-23 谱 分 布 在 f= 15/48 
上 的 QQ 图 


0 5 


平均 谱 密 度 估计 


Bucy 
Se ey ee 
OEE So 


10 15 0.0 0,1 0.2 0.3 


卡 方 分 位 数 频率 


图 表 13-25 ”样本 谱 密 度 的 标准 差 : 模拟 AR(2)， 


— 


谱 密 度 估计 的 标准 过 
= 三 名 


图 表 13-24 平均 样本 谱 密 度 : 模拟 AR(2), 
$1=1.5, $=—0.75, n=96 


oe ee NaF 


atotetel ee ee ta 


0.5 


图 表 13-26 WHAE f= 40/96 


$,=1.5, ¢=—-0.75, n=96 上 的 QQ 图 


一 一 
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当然 ， 对 于 隐 含 的 理论 谱 密 度 而 言 ， 上 述 结果 无 一 说 明 样 本 谱 密 度 是 个 可 接受 的 估计 ， 样 
本 谱 密度 是 相当 一 般 的 渐 近 无 偏 估 计 ， 但 也 是 不 一 致 的 ， 作 为 可 用 的 估计 存在 极 大 的 可 变性 . 
在 傅 里 叶 频 率 上 的 渐 近 独立 性 也 有 助 于 解释 样本 诺 密 度 在 性 能 上 的 极端 可 变性 . 


13. 7 


小 结 


本 章 介 绍 了 将 时 间 序 列 用 正弦 和 余弦 的 线性 组 合 进行 建 模 的 思想 一 一 即 所 谓 的 谱 分 析 . 引 
入 了 周期 图 ， 借 助 这 一 工具 来 定位 序列 的 谱 表 示 上 各 种 频率 所 起 的 作用 .进而 扩展 这 一 思路 ， 
应 用 到 了 连续 频段 的 建 模 问题 上 ， 还 研究 了 ARMA 模型 的 谱 密度 ， 最 后 讲述 了 样本 谱 密 度 的 
采样 性 质 ， 鉴 于 样本 谱 密度 并 非 理论 谱 密度 的 一 致 估计 ， 所 以 有 必要 进一步 探求 可 接受 的 估 
计 ， 而 这 正 是 下 一 章 的 主题 ， 


习题 
13. 1 


13.2 
13.3 


13.4 


13.5 


13. 6 
13.7 
13.8 


找到 使 下 式 成 立 的 4A AB: 3cos(2xft+0.4) =Acos(2xft)+Bsin(2x/ft). 

RE) R Al D (HIS R cosl nft tHo) =cos(2nft) +3sin(2rft). 

对 于 图 表 13-2 所 示 的 序列 ， 

(a) WEHE f=4/96 时 ， 用 cos(2nft) Alsin(2n fe) 对 序列 进行 回归 ， 能 够 得 到 A MB 
的 准确 佑 计 . 

(b 利用 方程 13.1.5) 得 出 当 频 率 为 f=14/96 时 ， RIEF R, ©, A 以 及 B 之 
间 的 关系 . (对 此 分 量 ， 振 幅 为 1， 相位 是 0. 6r. ) 

(c) 证 明 : 在 f=14/96 时 ， 用 cos(2nft) 和 sin(2r 产 ) 对 序列 进行 回归 ， 能够 得 到 A 
和 B 的 准确 佑 计 . 

(d) 证明 ， 同时 在 f=4/96 及 f—14/96 E, JH cos(2xft) 和 sin(2nfe) 对 序列 进行 回 
归 ， 能 够 得 到 As Bo An 和 Bi 的 准确 估计. 

Ce) WEAR: 同时 在 f=3/96 及 f=13/96 E, 用 cos(2xft1) 和 sin(2xft) 对 序列 进行 回 
归 ， 能 够 得 到 As’ By. AA Bis HER ATT. 

(fy 重复 〈d) ， 但 在 其 他 的 任意 傅 里 叶 频 率 上 增加 第 三 对 余弦 -正弦 预测 变量 ， 证 明 : 
所 有 回归 系数 仍 能 够 准确 估计 . 

生成 或 者 选取 任意 长 度 n=10 的 序列 . 证 明 用 傅 里 叶 频 率 上 足够 多 的 余弦 -正弦 曲线 构 

造 的 线性 组 合 可 以 准确 地 拟 合 该 序列 . 

用 方程 (13. 2. 4) 中 的 模型 模拟 一 个 信和 号 十 噪声 的 时 间 序 列 ， 并 采用 与 图 表 13-4 中 相 

同 的 参数 值 . 

(a) 绘 出 时 间 序 列 并 寻找 周期 ， 能 看 到 吗 ? 

(b) 绘 出 模拟 序列 的 周期 图 .现在 周期 清楚 了 吗 ? 

证 明 ， 由 方程 (13. 3. D 定义 的 序列 的 协 方差 函数 由 方程 (13. 3. 2) 的 表达 武 给 出 . 

写 出 建立 方程 03.3.10 HAR. 

若 {X,) 与 {Y,) 为 独立 的 平稳 序列 ， 证明 XHY) 的 谱 密 度 是 {X,} 与 (Y) WE 

度 的 和 . 
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13.9 WEB: 4 0>0 f, MAC) 过 程 的 谱 密度 是 频率 的 增 函 数 ， 当 0 一 0 时 ， 是 减 函 数 . 


13. 


13. 


13. 


10 


11 


.12 
.13 


.14 


26 


绘 出 0=0. 6 的 MAC) 过 程 的 理论 谱 密 度 ， 并 解释 在 时 间 序 列 值 可 能 的 绘图 点 上 频谱 

形状 的 含义 ， 

绘 出 9 二 一 0. 8 的 MA(1) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 绘图 点 上 频 

谱 形状 的 含义 . 

证 明 : ARG) 过 程 的 谱 密度 ， 当 %>0 时 是 减 函 数 ， 而 当 %<0 AY eH eM. 

绘 出 $==0.7 的 ARC) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 绘图 点 上 频谱 

形状 的 含义 ， 

绘 出 d=—0.4 的 ARC) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 绘图 点 上 频 

谱 形状 的 含义 . 

绘 出 0 二 一 0.5 及 如 = 二 0.9 时 MA(2) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 

绘图 点 上 频谱 形状 的 含义 . 

绘 出 二 0.5 及 如 二 一 0.9 时 MA(2) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 

绘图 点 上 频谱 形状 的 含义 . 

绘 出 加 二 一 0.1 及 各 二 一 0.9 时 AR(2)〉 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 

的 绘图 点 上 频谱 形状 的 含义 . 

2 p =1.8 及 各 二 一 0.9 时 ARC) 过 程 的 理论 谱 密 度 ， 并 解释 在 时 间 序 列 值 可 能 的 

绘图 点 上 频谱 形状 的 含义 . 

绘 出 办 二 一 1] 及 加 二 一 0.8 时 AR(2) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 

绘图 点 上 频谱 形状 的 含义 . 

vei p =0.5 及 加 = 二 0.4 时 AR(2) 过 程 的 理论 谱 密 度 ， 并 解释 在 时 间 序 列 值 可 能 的 绘 

图 点 上 频谱 形状 的 含义 . 

oii dg =0 及 加 二 0.8 时 ARO) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 能 的 绘图 

点 上 频谱 形状 的 含义 . 

iid =0. 8 及 加 二 一 0.2 时 AR(2) 过 程 的 理论 谱 密 度 ， 并 解释 在 时 间 序 列 值 可 能 的 

绘图 点 上 频谱 形状 的 含义 . 

绘 出 $=0.5 及 6=0.8 时 ARMA(1，1) 过 程 的 理论 谱 密 度 ， 并 解释 在 时 间 序 列 值 可 能 

的 绘图 点 上 频谱 形状 的 含义 . 

绘 出 $ 二 0.95 及 0=0.8 时 ARMA(1，1) 过 程 的 理论 谱 密度 ， 并 解释 在 时 间 序 列 值 可 

能 的 绘图 点 上 频谱 形状 的 含义 . 

A> (X) 为 平稳 序列 ，{Y,) 定义 为 Y,==(X, 十 X,-))/2. 

(a) 求 此 线性 滤波 器 的 畴 转移 函数 . 

(b) 这 是 个 因果 滤波 器 吗 ? 

(O 给 出 寡 转 移 函 数 ， 并 描述 使 用 这 个 滤波 器 的 效果 ， 即 说 出 经 滤波 后 哪些 频率 保留 
下 来 了 (被 强调 ) ， 而 哪些 频率 未 被 强调 (被 衰减 掉 )? 

A> {X 为 平稳 序列 ，{Y,} ÆA Y =X X-a. 

Ca) SR IBS PE UE Mk AE I EE R A. 

(b) 这 是 个 因果 滤波 器 吗 ? 


谱 分 析 入 门 249 


13.27 


13. 28 


13. 29 


13. 30 


13. 31 


13. 32 


13. 33 


(c) SH RRB eM, FRET NR, Bi Ae ee ah eR E 
下 来 了 (被 强调 )， 而 哪些 频率 未 被 强调 (被 衰减 掉 ). 

S {X,) ABR, OY.) BMW YH CX t Xt X-1)/3. 

Ca) 求 此 线性 滤波 器 的 寡 转 移 函 数 . 

Cb) 这 是 个 因果 滤波 器 吗 ? 

Cc) 绘 出 短 转移 函数 ， 并 描述 使 用 这 个 滤波 器 的 效果 .， 即 说 出 经 滤波 后 哪些 频率 保留 
下 来 了 (被 强调 );， 而 哪些 频率 未 被 强调 (被 衰减 掉 )? 

令 (Xo 为 平稳 序列 ， + (Y) BMA Y, =X, +X- tX) 173. 

(a) 证 明 : 此 滤波 器 与 习 古 13. 27 中 所 定义 的 滤波 器 有 相同 的 迄 转 移师 数 . 

Cb) 这 是 个 因果 滤波 器 吗 ? 

S (X) 为 平稳 序列 ， 令 (Y) BRAY, 5X Xe. 

Ca) 求 此 线性 滤波 器 的 苦 转 移 函 数 . 

(b 绘 出 寡 转 移 函 数 ， 并 描述 使 用 这 个 滤波 器 的 效果 ， 即 说 出 经 滤波 后 哪些 频率 你 留 
下 来 了 (被 强调 )， 而 哪些 频率 未 被 强调 (被 衰减 掉 )? 

令 (X) 为 平稳 序列 ， 令 (Y) 定义 为 Y= 二 (Xt1 一 2X, 十 1)/3. 

(a) 求 此 线性 滤波 器 的 宕 转移 函数 ， 

(b) 绘 出 宕 转移 函数 ， 并 描述 使 用 这 个 滤波 器 的 效果 ， 即 说 出 经 滤波 后 哪些 频率 傈 留 
下 来 了 (被 强调 ) ， 而 哪些 频率 未 被 强调 〈 被 衰减 掉 )? 

设 (Y) 为 白 噪 声 过 程 ， 但 不 必 是 正 态 的 . 在 全 里 叶 频 率 上 ， 用 附录 丁 给 出 的 正 区 性 

Ja WEAR F028 te : | 

(a) 样本 谱 密 度 是 理论 谱 密度 的 无 假 估 计 ， 

(O 对 任意 傅 里 叶 频 率 f 和 f;， 变量 A/ 5B, AX. 

Cc) 若 傅 里 时 频率 Af. WERA, 与 A 无 关 . 

比照 图 表 13-21、13-22、13-23 和 13-24， 做 一 个 模拟 分 析 ， 使 用 ARC) 模型 ， 其 中 

出 一 0.5， 上 山王 0.8，7 一 48， 重 复 序 列 1000 X. 

(a) 绘 出 平均 样本 谱 密 度 基 于 频率 的 图 ， 并 以 之 与 大 样本 理论 对 比 . 

(b) 绘 出 样本 谱 密 度 标 准 差 基 于 频率 的 图 ， 并 以 之 与 大 样本 理论 对 比 . 

(ce) 绘 出 经 恰当 归 一 化 后 样本 谱 密 度 的 QQ 图 ， 在 若干 频率 上 与 大 样本 理论 对 比 ， 并 
讨论 结果 . 

比照 图 表 13-21、 图 表 13-22、 图 表 13-23 和 图 表 13-24， 做 一 个 模拟 分 析 ， 使 用 AR(2) 

模型 ， 其 中 四 一 一 1， $a =— 0.75, n=96. 重复 时 间 序 列 1000 次 . 

(a) 绘 出 平均 样本 谱 密 度 基于 频率 的 图 ， 并 以 之 与 使 用 大 样本 理论 得 出 的 预测 结果 进 
行 比较 . 

(b) 给 出 样本 谱 密 度 标准 差 茜 于 频率 的 图 ， 并 以 之 与 使 用 大 样本 理论 得 出 的 预测 结果 
进行 比较 . 

(c) 绘 出 经 恰当 归 一 化 后 样本 谱 密 度 的 QQ 图 ， 并 与 大 样本 理论 在 若干 频率 上 预测 的 
Seve RT th, FIR. 
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13.34 模拟 一 个 长 度 n= 1000 的 零 均 值 、 单 位 方差 、 正 态 白 噪声 时 间 序 列 . 
图 ， 并 对 结果 给 出 评述 . 


附录 」 余弦 与 正弦 序列 的 正 交 性 


: k z j= kG A0 Ñ n/2) 
2, cos( 2x +t) cos(2n =t) 一 Tei 
0 iFR 
A . n i= kG 0 /2) 
2, sin( 2x <-t) sin( 2x Za) = E £ 7 了 0 或 nn 
Í Í 0 jH#k 


ni FAP aR (DeMoivre) 定理 ， 可 以 很 容易 地 证 出 这 些 结果 : 
e "i = cos(2x/) — lisin(2rxf) 


或 者 等 价 地 ， 使 用 如 下 的 欧 拉 公 式 : 
2rif __ prif 


cos(2xf) = one, sin(2xf) = £ n 
一 并 使 用 几何 序列 有 限 级 数 的 相关 结果 ， 即 


~ rlr") 
pe 


j=l 


这 里 rél 是 实数 或 复数 . 
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画 出 序列 的 周期 
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(13. J. 
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第 14 章 谱 估 it 


多 年 来 学 界 曾 提出 并 研究 过 众多 的 方法 ， 用 以 构造 合理 的 谱 密 度 估计 ， 本 章 我 们 将 基于 当 
前 的 计算 能 力 ， 重 点 介绍 其 中 广 为 接 受 的 部 分 方法 . 所谓 谱 密度 的 非 参 数 估计 〈 即 样本 谱 密 度 
的 平滑 ) 基本 无 需 事 先 假定 “真实 ” 谱 密 度 的 形状 . 参数 估计 假设 自 回 归 模 型 一 一 可 能 为 高 阶 
的 一 一 能 够 给 出 时 间 序 列 的 充分 的 拟 合 结 果 ， 估 计 得 到 的 谱 密 度 因此 是 基于 被 拟 合 的 AR 模型 
的 理论 谱 密 度 . 本 章 还 简 述 了 一 些 其 他 方法 . 


14.1 平滑 谱 密 度 


这 里 基本 的 思想 是 多 数 谱 密度 在 小 频率 区 间 上 变化 不 大 ， 因此， 可 以 在 小 频率 区 间 上 对 样 
本 谱 密 度 的 值 取 平 均 ， 以 达到 降低 变动 性 的 目的 .必须 注意 在 这 样 处 理 时 ， 有 可 能 使 估计 有 
偏 ， 事 实 上 ， 理 论 谱 密度 在 区 间 上 的 确 有 所 变化 ， 在 降低 变动 性 和 引入 偏差 之 间 总 要 有 所 折 
中 ， 因 此 需要 判断 并 确定 在 各 种 特殊 情况 下 ， 在 多 大 程度 上 取 平 均 更 合适 ， 

A 三 为 某 傅 里 叶 频 率 ， 以 频率 f 为 中 心 ， 两 边 都 扩展 m 个 傅 里 叶 频 率 ， 对 这 些 频 率 上 的 
样本 谱 密 度 值 ， 考 虑 简单 地 取 平 均值 的 方法 . 这样 是 对 2m 十 1 个 样本 谱 值 取 平 均 ， 得 到 的 平 
滑 样 本 谱 密 度 是 

SA = a (f+) (14.1.1) 


(对 于 在 接近 端点 0 和 1/2 的 频率 上 取 平 均 时 ， 按 周期 图 在 0 和 1/2 附近 对 称 进行 处 理 . ) 
更 一 般 地 ， 可 以 用 一 个 具有 下 面 性 质 的 加 权 函 数 (或 称 谱 窗 W,(f)) 对 样本 谱 予 以 平滑 : 


W,(k) 之 0 
Walk) = gh R? (14. 1. 2) 
Siw, =1 
得 出 谱 密 度 的 平滑 估计 为 
Sp = Swe) (f+) (14. 1. 3) 
方程 (14. 1. 1) 中 所 示 的 简单 平均 对 应 于 矩形 谱 赣 
Wk) = 5, —m<k<m (14. 1. 4) 


出 于 历史 原因 ， 为 纪念 20 世纪 40 年 代 首 度 使 用 的 P. J. Daniell， 这 一 谱 窗 一 般 称 为 
Daniell 谱 窗 . 

举 个 例子 ， 考 虑 模拟 的 ARC) 序列 ， 其 样本 谱 密度 见 图 表 13-20， 图 表 14-1 绘 出 了 应 用 
m=5 的 Daniell 窗 得 到 的 平滑 样本 谱 ， 真 实 的 谱 再 次 用 虚线 示 出 ， 从 样本 谱 中 可 以 看 出 ， 经 平 
滑 确实 降低 了 部 分 变动 性 . 
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图 表 14-1 使 用 m=5 的 Daniell 窗 得 到 的 平滑 谱 


平滑 样本 谱 密度 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


win.graph (width=4.875,height=2.5,pointsize=8) 

set .seed (271435); n=200; phi=-0.6 

y=arima.sim(model=list (ar=phi) ,n=n) 

k=kernel ('daniell',m=5) 

sp=spec (y, kernel=k, log='no',sub='',xlab='Frequency', 
ylab='Smoothed Sample Spectral Density') 

lines (sp$freq, ARMAspec (model=list (ar=phi) ,freq=sp$freq, 
plot=F) $spec, 1lty='dotted') 


若 拓展 平滑 窗 的 宽度 (BIS mr 变 大 )， 可 以 进一步 降低 变动 性 ， 图 表 14-2 RMT Rms 
15 时 的 平滑 谱 . 不 断 平滑 的 风险 是 可 能 遗漏 重要 的 细节 ， 并 引入 偏差 .认识 到 以 引信 偏差 
为 代价 来 降低 变动 性 之 间 的 取舍 后 ， 显 见 必 要 的 平滑 量 总 是 来 自 试 错 判 断 . 


图 表 14-2 使 用 m=15 的 Daniell 窗 得 到 的 平滑 谱 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


> k=kernel ('daniell',m=15) 

> sp=spec(y,kernel=k,log='no',sub='',xlab='Frequency', 
ylab='Smoothed Sample Spectral Density') 

> lines (sp$freq, ARMAspec (model=list (ar=phi) , freq=sp$freq, 
plot=F) $spec, lty='dotted') 


其 他 的 谱 窗 

过 去 还 提出 过 许多 其 他 类 型 的 谱 窗 .特别 地 ， 通 过 降低 极 值 点 权重 的 方法 ， 能 够 有 效 软 化 
Daniell 窗 端 点 的 剧烈 变化 ， 所 谓 修正 的 Daniell 谱 窗 简单 定义 了 两 个 极 值 点 权重 均 取 为 其 他 权 
重 的 一 半 ， 仍 然 维 持 权 重 之 和 为 1 的 性 质 ， 图 表 14-3 中 最 左边 的 图 显示 了 m=3 时 的 修正 
Daniell 谱 窗 . 
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应 用 了 所 有 谱 窗 的 卷 积 ， 如 果 在 mm 一 3 时 ， 两 次 使 用 修正 的 Daniell 谱 窗 〈 与 自身 求 卷 积 ) ， 实 际 上 就 
是 使 用 了 图 表 14-3 中 间 图 形 所 示 的 (几乎 ) 三 角 窗 .第 三 种 平滑 (m= 二 3) 等 价 于 使 用 最 右边 的 图 示 
出 的 谱 窗 ， 其 与 正 态 曲线 很 相似 、 这 里 还 可 以 在 卷 积 的 不 同 分 量 上 使 用 其 他 的 m tE. 

对 于 谱 窗 形状 不 及 m 的 选择 重要 的 看 法 ， 多 数学 者 意见 一 致 . 在 下 面 的 例子 里 ” ， 我 们 将 
应 用 修正 的 Daniell 谱 窗 一 一 可 能 进行 一 次 或 两 次 卷 积 运算 . 


14.2 偏差 和 方差 

如 果 平 滑 窗 所 在 的 频段 上 理论 谱 密 度 变化 不 大 ， 则 平滑 后 的 估计 可 望 为 渐 近 无 偏 的 .应 用 
此 有 逼近、 方程 (14. 1. 2) 的 谱 窗 性 质 以 及 部 分 泰勒 展开 进行 计算 ， 得 到 

EL[5(f)J~ >) WaS(f +2) ~ > Wah [SN +58 N+5(7) SD) 


或 
ELS] ~ (A +4 SOP SW, Cb) (14. 2.1) 
| LSA Sz 
bias ~ + SA SRW. (A) (14. 2. 2) 


k =--m 


对 于 Daniell 矩形 谱 窗 ， 有 


1 wt: 2 m? mm 
一 - W 二 一 一 一 一 一 [一 十 一 十 一 14. 2. 3) 
oak aN? Fm +1) ( 3° 2 F 6 ) i 


因而 只 要 m/n>0, 4 n 一 co 时， 偏差 趋 于 零 . 
利用 样本 谱 密 度 在 傅 里 叶 频 率 上 的 值 渐 近 无 关 的 事实 以 及 方程 (13. 6. 5)， 还 能 得 到 平滑 
谱 密 度 方差 的 一 个 有 用 的 示 近 如 下 : 
Var[§(/)] ~ >) WE) Var[ 8(F +2) ~ SI We Ck) Sf) 
因而 
© 在 RR 中 ,修正 的 Daniel 核 是 用 于 平滑 样本 谱 的 缺 省 核 ， 通 过 简单 确定 spec 函数 中 的 span 一 2m 十 1， 可 以 确定 m, 
这 里 span 是 spans 参数 的 缩写 . 
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Var[S(f)] = Sf) 5) WEC) (14. 2. 4) 
k= -m 


有 一 致 性 . 
一 般 地 ， 当 n>, ERA m/n—-0 以 减 小 偏差 ，za 一 ce 以 减 小 方差 . 一 个 现实 情况 是 ， 
样本 量 n 常常 是 固定 的 ， 因 此 必须 由 平衡 偏差 与 方差 的 考量 来 选择 m. 
Jenkins 和 Watts (1968) 建议 尝试 三 个 不 等 值 的 m.， 小 的 m 值 能 够 揭示 S(f) 中 大 的 峰值 
何在 ， 但 可 能 会 显示 许多 高 峰 ， 这 其 中 很 多 是 假 的 . 大 的 m 值 生成 的 曲线 可 能 过 于 平滑 ， 则 
折 中 的 结果 是 取 自 m 的 第 三 个 值 ，Chatfield(2004，135 W) 建议 用 m= 二 Vn， 通 常 试用 2 Vn, 


VR， 这 Vn 等 mm 值 ， 可 以 对 真实 谱 的 形状 有 所 揭示 ， 由 于 窗 宽 随 m 变 少 而 变 小 ， 有 时 也 称 之 为 
关闭 窗口 .正如 Hannan(1973，311 W) 所 说 ,“ 经 验 是 真正 的 老师 ， 书 中 无 可 寻 更 .” 


14.3 带宽 


要 注意 的 是 ， 在 方程 14.2.2) 给 出 的 渐 近 偏差 中 ， 乘 子 S(/) 依赖 于 真实 谱 密度 的 曲率 ， 如 
果 在 f 附近 SCP) 有 尖峰 ， 则 系数 值 会 较 大 ， 若 f 附近 S(f) 形状 扁平 ， 则 系数 值 会 较 小 ， 这 有 着 
直观 的 意义 ， 因 为 在 假定 真实 谱 密 度 于 谱 窗 内 的 频率 上 变化 很 小 的 前 担 下， 会 产生 平滑 样本 谱 密度 
的 动机 .方程 (14. 2. 2) 的 渐 近 偏差 中 其 他 乘 子 的 平方 根 有 时 也 称 为 谱 窗 的 带宽 BW, B 


Bw=+ | yzW。(R) (14. 3. 1) 


n k=—m 


如 前 对 方程 (14.2.3) 所 述 ， 对 于 Daniell 窗 来 说 ， 只 要 m/n—>0, W4 n>}, BW 趋 于 零 ， 根 据 
方程 (14. 1. 2) ， 谱 窗 具 有 离散 零 均 值 概率 密度 函数 的 数学 性 质 ， 因 此 这 里 所 定义 的 BW 可 看 成 是 正 
比 于 谱 窗 的 标准 差 . 从 而 ， 它 是 一 种 度量 谱 窗 宽度 的 方法 ， 可 解释 为 平滑 样本 谱 密度 时 对 所 用 频 市 
宽度 的 一 种 度量 ， 假 如 真实 谱 包含 两 个 相对 于 谱 窗 带宽 而 言 比较 靠近 的 峰 ， 则 在 计算 5(.P) 时 这 两 个 
峰 将 同时 被 平滑 ， 并 不 被 视 为 独立 的 两 个 峰 ， 要 注意 的 是 ， 在 各 类 时 间 序 列 文献 里 ， 有 很 多 其 他 的 
带宽 的 定义 ，Priestley(1981 ，513 一 528 页 ) 用 相当 大 的 篇 幅 讨论 了 各 种 定义 的 优 沙 . 


14.4 谱 置 信 区 间 


平滑 样本 谱 密 度 渐 近 的 分 布 性 质 可 以 很 容易 地 用 于 得 到 谱 的 置信 区 间 . 平滑 样本 谱 密 度 是 
具有 渐 近 卡 方 分 布 的 量 的 线性 组 合 。 这 种 情况 下 ,通常 使 用 另 一 个 卡 方 分 布 的 阁 干 倍 来 作 双 
近 ， 该 分 布 的 自由 度 通 过 匹配 均值 及 方差 得 到 .假设 由 方程 (14. 2. 4) 给 出 的 方差 的 SC(f) 大 
致 无 偏 ， 则 匹配 方差 与 均值 将 引致 对 于 下 面 分 布 的 允 近 : 


uS Cf) 
Sif) (14. 4. 1) 


上 面 所 用 的 卡 方 分 布 的 自由 度 由 下 式 给 出 : 
y= ee eee (14. 4. 2) 
>) WE (Ck) 


k=—m 


te fe tf 255 


&y ,为 vy 个 自由 度 的 卡 方 分 布 的 第 100(a/2) 个 百 分 位 数 ， 不 等 式 
vf) 
SCA) 
可 以 转化 成 S(f) 的 100(1 一 a)% 置 信和 表述 如 下 : 


SCA) scp) < SD (14. 4. 3) 


ae < < —_ 


ui =g t Prai 


公式 中 ， 置 信 区 间 的 宽度 随 频 率 变化 而 变 ， 回 顾 方程 (14. 2.4) 所 述 ，S(f) 的 方差 大 致 正比 
于 其 均值 的 平方 .如 方程 (5. 4. 1) 及 (5.4.2) 所 示 ， 对 平滑 样本 谱 密 度 取 对 数 以 稳定 方差 ， 
得 到 宽度 与 频率 无 关 的 置信 区 间 如 下 : 
5 一 |] 这] < log[S A] +] n (14. 4. 4) 
log S¢f)] + log] = | og| SC f) ] og SC 请 ] + og| > | 


正 是 出 于 这 些 原因 ， 通 常 的 做 法 是 绘制 估计 谱 的 对 数 图 ， 如 果 用 对 数 重 绘图 表 14-2， 就 得 到 图 
表 14-4， 其 中 也 画 出 了 ARC) 模型 95 听 置信 和 极限 (点 状 虚 线 ) 及 其 真实 谱 密 度 〈 段 状 虚线 ). 
除 极 少 的 例外 ， 置 信 极 限 准 确 刻画 了 真实 的 谱 密 度 . 


图 表 14-4 得 自 平滑 谱 密 度 的 置信 极限 


= 


log (FHT FEA ERE) 


> set.seed (271435); n=200; phi=-0.6 

> y=arima.sim(model=list (ar=phi) ,n=n) 

> k=kernel ('daniell',m=15) 

> sp=spec(y,kernel=k,sub='',xlab='Frequency', 
ylab='Log(Smoothed Spectral Density)', ci.plot=T,ci.col=NULL) 

> lines (spSfreq, ARMAspec (model=list (ar=phi) ,sp$freq,plot=F)$spec, 
lty='dashed') 


图 表 14-5 给 出 了 一 个 较 清 晰 的 置信 极限 图 示 ， 图 中 右上 角 示 出 了 95% 置 信 区 间 及 带宽 
引导 一 一 “十 字 准 线 ”， 垂 直 的 长 度 即 为 置信 区 间 的 长 度 〈 宽 度 ) ， 而 水 平 线段 则 标示 了 置信 
区 间 的 中 心 点 9 ， 其 宽度 KE) 与 谱 窗 带宽 相 匹配 . 假设 重新 配置 引导 点 ， 连 同 十 字 线 在 
任意 频率 的 平滑 谱 上 居中 ， 则 会 得 到 “真实 ” 谱 密度 在 该 频率 上 垂直 置信 区 间 的 显示 ， 以 及 
平滑 程度 的 大 概 引 导 . 这 一 模拟 示例 里 ， 仍 用 虚线 画 出 真实 的 谱 . 


一 -一 -一 一 一 


O AEH. PUR (14. 4. 4) 确定 的 是 非 对 称 置信 区 间 ， 所 以 中 心 点 并 非 位 于 两 个 端点 的 中 间 位 置 . 此 例 使 用 了 修正 的 
Daniell 窗 ， 其 中 m=15, A hÈ v 一 61， 因 而 所 用 卡 方 分 布 实际 上 是 个 正 态 分 布 ， 其 置信 区 间 差 不 多 是 对 称 的 ， 


图 表 14-5 得 自 图 表 14-2 的 平滑 谱 的 对 数 


log〔 平 滑 样本 谱 密 度 ) 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


> sp=spec (y, span=31,sub='',xlab='Frequency', 
ylab='Log(Smoothed Sample Spectrum) ') 

> lines (sp$freq, ARMAspec (model=list (ar=phi) ,sp$freq, 
plot=F) $spec, lty='dotted') 


14.5 泄露 和 锥 前 


前 面 很 多 讨论 都 是 假定 我 们 的 兴趣 所 在 为 傅 里 时 频率 ， 如 其 不 然 呢 ? 图 表 14-6 是 长 度 n=96 
时 在 频率 f=0. 088 和 f=14/96 上 有 两 个 纯 余 弦 - 正 弱 分 量 的 序列 的 周期 图 ， 其 模型 为 


Y, = 3cos[2x(0. 088)2] + sinf2x( 56) ¢] (14. 5. 1) 


注意 在 n=96 hf, f=0. 088 并 非 伟 里 叶 频 率 ， 图 中 明确 显示 了 在 伟 里 叶 频 率 =14/9 FAR 
低 功率 的 尖峰 ， 但 没有 显示 f= 二 0.088 上 的 尖峰 ， 此 频率 上 的 功率 反而 为 若干 邻近 频率 上 的 所 
掩盖 ， 意 味 着 一 个 有 比较 大 宽度 高 峰 的 存在 . 


图 表 14-6 在 f=0.088 和 f=14/96 上 存在 尖峰 的 序列 的 周期 图 


0.088 14/96 频率 


= 
> win.graph(width=4.875,height=2.5,pointsize=8) 

> t=1:96; £1=0.088; £2=14/96 

> y=3*cos(f£1*2*pi*t)+sin(f£2*2*pi*t) 

> periodogram(y); abline (h=0) 
OO -一 
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代数 分 析 ” 表明 ， 周 期 图 可 视 为 一 个 “已 平滑 ”的 谱 密度 ， 所 用 谱 窗 为 狄 利克 雷 (Dirichlet) 
核 ， 见 下 式 : 

D(P = 一 ers (14. 5. 2) 
注意 ， 对 所 有 形 如 f 二 j/n KEM, BAD |) =0， 因 此 该 窗 在 这 些 频率 上 不 会 有 任何 
作用 . 但 是 ， 图 表 14-7 左边 给 出 的 D(f) 的 图 显示 ， 主峰 两 人 出 有 明显 的 “ 旁 淮 ”， 这 会 导致 非 
傅 里 时 频率 上 的 功率 泄露 进 附 近 傅 里 时 频率 上 的 功率 中 ， 如 图 表 14-6 Bm. 

锥 市 是 用 于 改善 旁 办 问题 的 一 种 方法 . 锥 削 通 过 降低 序列 两 端 数据 的 幅度 ， 使 其 数值 慢 慢 
趋 于 数据 均值 零 . 基本 思路 是 ， 在 计算 有 限 长 度 序列 的 傅 里 叶 变 换 时 ， 降 低 边界 效应 ， 如果 对 
序列 进行 锥 前 以 后 再 来 计算 周期 图 ， 其 效果 就 是 对 ”一 100 应 用 如 图 表 14-7 右边 所 示 修 正 的 狄 
利克 雷 核 ， 如 此 旁 为 就 被 根本 消除 了 . 


图 表 14-7” 狄 利克 雪 核 与 锥 浊 后 的 狄 利克 雷 核 
1.0 : 


0.6- 
D - 
0.2- 
-0.2 - 
-0.10 -0.05 -0.00 0.05 0.10 -0.10 -0.05 -0.00 0.05 0.10 
频率 频率 _ 


锥 削 最 常用 的 形式 基于 余弦 钟 ， 用 Y 代替 原来 的 序列 Y,， 
Y., = hY, (l4. 5.3) 
其 中 的 为 余 纺 钟 ， 例 如 由 下 式 给 出 : 
1 2xtt — 0. 5) 
h, = 去 = oe | (14. 5. 4) 


图 表 14-8 左边 给 出 了 一 个 x 二 100 的 余弦 钟 的 图 ， 更 常用 的 锥 前 由 分 裂 余 东 钟 给 出 ， 即 仅 将 余 
弦 锥 削 应 用 于 时 间 序 列 的 极点 而 得 到 ， 分 裂 余 弦 钟 锥 前 由 下 式 给 出 ; 


oa lt m 


m 
h, = 21 > m+] Ss Ser (14.5.5) 
| I n—-m+1l=t<in 


这 称 为 一 个 1100p NAME SEM, Hp p=2m/n. 图表 14-8 右边 示 出 了 一 个 1OXDBRKH 
锥 曾 ， 其 中 n==100， 注 意 每 端 都 有 一 个 10% 的 锥 前 ， 总 计 有 20%. SOR 10% 20% HA 
余 弦 钟 都 很 常用 . 


© 详 见 附录 K. 
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图 表 14-8 RAHM ARRAREN, n= 100 

1.0 
0.8 

Ë 0.6 - 
j 0.4 
0.2 


0.0 —— 
0 20 40 60 80 100 0 20 40 60 gü 100 
时 间 时 间 


回 到 前 面 所 提 到 的 可 变 恒星 亮度 数据 的 例子 上 .图表 14-9 给 出 了 该 序列 具有 不 同 锥 削 的 
四 个 周期 图 ， 根据 各 自 “ 十 字 准 线 ” 所 示 95% 置 信和 区 间 的 长 度 判 断 ， 能 够 看 出 原先 未 经 锥 前 
的 周期 图 中 ， 在 频率 用 二 21/600 和 f; 二 25/600 上 的 两 个 尖峰 很 明显 是 真实 存在 的 .更 详细 的 
分 析 表 明 ， 由 最 底下 的 周期 图 最 好 地 显示 出 的 小 尖峰 ， 事 实 上 全 是 频率 f 和 f; NRK. 在 
Bloomfield(2000) 中 有 关于 降低 泄露 和 锥 前 的 更 多 的 论述 . 


图 表 14-9 具有 0%、10%、20% 和 50% 锥 前 的 可 变 恒星 光谱 


| 


le-07 le-0l le=07 le=0] 


le-07 Je-O1 


le-07 le-0! 
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14.6 自 回 归 谱 估计 


在 前 述 谱 密度 估计 的 章节 里 ， 并 未 对 真实 谱 密 度 的 参数 化 形式 提出 任何 前 提 假 设 . 但 还 有 
另 一 种 用 于 谱 密度 估计 的 方法 ， 即 对 于 某 一 时 间 序 列 ， 首 先 拟 合 一 个 AR，MA 或 是 ARMA 
模型 ， 继 而 用 该 带 估计 参数 的 模型 的 谱 密 度 作 为 被 估计 的 谱 密 度 . (在 13. 5 THE, 已 探讨 过 
ARMA 模型 的 谱 密度 . ) 为 使 AIC 准则 最 小 化 ， 常 用 的 AR 模型 的 阶 数 往往 取得 尽 可 能 大 . 

以 图 表 13-20、 图 表 14-1、 图 表 14-2 和 图 表 14-5 中 用 过 的 % 一 一 0.6 及 n=200 的 模拟 AR 
PAAR. BUA AR 模型 ， 通 过 最 小 化 AIC 来 选取 阶 数 ， 然 后 绘 出 该 模型 估计 的 谱 密 度 ， 
所 得 结果 见 图 表 14-10. 

图 表 14-10 ” 谱 密 度 的 自 回归 估计 


0 


log CARTES HEATH 


> sp=spec(y,method='ar',sub='',xlab='Frequency', 
ylab='Log(AR Spectral Density Estimate') 

> lines (sp$freq, ARMAspec (model=list (ar=phi) ,freq=sp$freq, 
plot=F) $spec,1lty='dotted') 


因为 这 些 是 模拟 数据 ， 所 以 图 上 也 用 虚线 绘 出 了 真实 的 谱 密 度 ， 在 此 ， 选 定 阶 数 p= 1, 
估计 的 谱 密度 与 真实 密度 重合 得 非常 好 ， 在 14. 8 节 还 会 给 出 一 些 真实 时 间 序 列 的 例子 . 


14. 7 模拟 数据 示例 

使 用 模拟 数据 以 感受 谱 分 析 是 个 很 有 用 的 方法 ， 既 然 我 们 明了 问题 的 答案 ， 那 么 在 选择 谱 
窗 和 带宽 时 就 能 看 出 相关 结果 的 优 劣 ， 下 面 ， 我 们 从 谱 上 含有 一 个 非常 强 的 尖峰 的 AR(2) 模 
型 的 讨论 开始 . 

AR{2)， 其 中 由 =1.5， 和 := 一 0.75: 有 尖峰 的 谱 

此 模型 的 谱 密度 大 致 在 f=0.08 上 包含 了 一 个 尖峰 ， 如 图 表 13-14 Prax. 使 用 这 个 ARO) 
模型 以 及 方差 为 1 的 白 品 声 项 来 模拟 一 个 时 间 序 列 ， 样 本 量 n=100. 图 表 14-11 画 出 了 三 个 佑 
计 谱 密度 ， 并 用 实 线 示 出 真实 的 密度 . 这 里 使 用 了 修正 的 Daniel 谱 窗 ， 窗 宽 span=2m+1 分 
别 取 不 同 的 值 3，9 和 15， 窗 宽 span 取 3 时 ， 得 到 平滑 程度 最 低 的 结果 ， 在 图 中 以 点 线 表示 ，. 
span 取 9 时 ， 所 得 结果 在 图 中 以 短 划 线 表示 . span 取 15 时 ， 得 到 平滑 最 好 的 结果 ， 在 图 中 以 
点 划 线 表示 ， 这 三 个 谱 窗 的 带宽 分 别 是 0.018，0. 052 和 0. 087. 图 中 仅 对 点 线 估 计 示 出 了 置信 
区 间 与 带宽 引导 ， 其 他 两 个 具有 更 宽 的 带宽 和 更 小 的 置信 区 间 . 虽然 基于 span=9 的 估计 可 能 


是 最 好 的 ， 但 其 对 高 峰 的 表示 效果 不 佳 . 
图 表 14-11 ”估计 的 谱 密度 
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win,graph(width=4.875,height=2.5,pointsize=8) 

set .seed (271435); n=100; phil=1.5; phi2=-.75 

y=arima:.sim(model=list (ar=c (phil, phi2) ) ,n=n) 

spl=spec (y, spans=3, sub='',1ty='dotted',xlab='Frequency', 
ylab='Log(Estimated Spectral Density) ') 

sp2=spec (y, spans=9,plot=F) ; sp3=spec (y, spans=15, plot=F) 

lines (sp2$freq, sp2$spec, lty='dashed') 

lines (sp3$freq, sp3$spec, lty='dotdash') 

f=seq(0.001, .5,by=.001) 

lines (f, ARMAspec (model=list (ar=c(phil,phi2)),freq=f, 
plot=F) $spec,lty='solid') 


vvv v 


vv vvv 


还 可 以 使 用 参数 化 谱 估计 的 想法 ， 并 基于 最 小 化 AIC 原则 利用 软件 选取 最 好 的 AR 模型 ， 
所 得 结果 正 是 图 表 14-12 中 所 示 的 估计 的 AR(2) RH. 这 是 对 该 谱 最 好 的 表示 ， 当 然 模型 的 
确 也 是 AR(2). 


图 表 14-12 AR 谱 估 计 : 估计 的 (AR) MEH (TK) 


log 《估计 的 AR 谱 密度 ) 


> sp4=spec(y,method='ar',1lty='dotted', 
xlab='Frequency',ylab='Log(Estimated AR Spectral Density) ') 
> f=seq(0.001,0.5, by 0.001) 
> lines (f,ARMAspec (model=list (ar=c(phil,phi2)),freq=f, 
plot=F) $spec, lty='solid') 
> sp4$method # This will tell you order of the AR model selected 
e na 
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AR({2)， 其 中 ¢,=0.1, ¢,=0.4: 有 低谷 的 谱 | 
FER RTA MARA RE AY AR(2) 模型 ， 其 真实 的 谱 见 图 表 13-15， 用 n=200 
和 具有 单位 方差 的 正 态 白 噪 声 来 模拟 这 一 模型 ， 并 绘 出 span 值 分 别 取 7，15 和 31 的 3 条 平滑 谱 佑 
it. 和 前 面 一 样 ， 置 信 区 间 的 极限 和 带宽 引导 对 应 的 是 最 小 值 的 span7， 因 而 给 出 了 最 军 的 带宽 和 最 
长 的 置信 区 间 ， 我 们 认为 取 值 居中 的 span=15 (RA S/n) 所 给 出 的 谱 估 计 最 合理 . 
图 表 14-13 有 低谷 的 谱 的 AR) 模型 的 谱 居 计 


log 《估计 的 谱 密 庶 ) 


> Use the R code for Exhibit 14.11 with new values for the 
> parameters. 


we 


图 表 14-14 显示 了 AR 谱 密 度 估计 ， 在 模型 AR(2) 的 真实 阶 数 上 达到 了 AIC 的 最 小 值 ， 
因此 估计 出 的 谱 密 度 非 常 好 . 
图 表 14-14 AR Ait: 估计 的 (AR). ARH (RR) 


== 


log 【估计 的 AR 谱 密 度 ) 


> Use the R code for Exhibits 14.11 and 14.12 with new values 
> for the parameters. 


ARMA(1, 1), HA ¢=0.5, 6=0.8 

$=0.5, 0=0. 8 的 混合 模型 ARMAC, D) 的 真实 谱 密度 见 图 表 13-17， 在 中 频 及 高 频 上 
内 容 丰 富 ， 而 在 低频 上 功率 极 小 ， 这 里 用 样本 量 n=500 以 及 单位 方差 的 正 态 白 噪 声 对 此 模型 
进行 模拟 ， 在 选取 m 时 ， 用 Vn 寺 22 为 引导 ， 并 在 图 表 14-15 中 绘 出 m 分别 取 值 11，23 和 45 
时 的 3 条 估计 曲线 ， 置 信 区 间 引 导 指 出 了 当 取 m= 二 11 时 所 产生 的 众多 尖峰 很 可 能 是 虚假 的 
(事实 上 的 确 是 )， 鉴 于 真实 谱 是 光滑 的 ， 故 由 平滑 度 最 大 的 取 值 m=45 所 给 出 的 估计 最 好 . 
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图 表 14-15 ARMA(1, 1) 过 程 的 谱 估 计 
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0.0 0.1 0.2 03 0.4 0.5 
频率 
> Win.graph (width=4.875,height=2.5,pointsize=8) 
> set.seed (324135); n=500; phi=.5; theta=.8 
> Y=arima.sim(model=list (ar=phi,ma=-theta) ,n=n) 
> spl=spec(y,spans=11,sub='',1lty='dotted', 
xlab='Frequency',ylab='Log(Estimated Spectral Density}') 

> Sp2=-spec (y,Spans=23,plot=F); sp3=spec(y,spans=45,plot=F) 
> lines (sp2$freq,sp2$spec,1lty='dashed' ) 
> lines (sp3$freq,sp3$spec, 1lty='dotdash' ) 
> E=seq{(0.001,.5,by=.001) 
> lines (£,ARMAspec (model=list (ar=phi,ma=-theta),f, 


plot=F)$spec,lty='solid') 


如 图 表 14-16 所 示 ， 基 于 AR 模型 的 参数 化 谱 估 计 并 不 好 ， 软 件 选 取 了 一 个 AR(3) 模型 ， 
但 是 得 出 的 谱 密 度 (点 线 ) 根本 不 能 很 好 地 重 现 真实 密度 的 形状 . 


图 表 14-16 ARMA (1, 1) 过 程 的 AR 谱 估 计 


log CHP AYAR ie Ss FED 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


> sp4=spec (y,method='ar', 1lty='dotted',ylim=c(.15,1.9), 
xlab='Frequency',ylab='Log(Estimated AR Spectral Density) ') 
> f=seq(0.001, .5,by=.001) 
> lines (f, ARMAspec (model=list (ar=phi,ma=-theta),f, 
plot=F) $spec,lty='solid') 
季节 MA, HH @=0.4, O=0.9, s=12 
我 们 选择 了 一 个 季节 过 程 作 为 有 关 模 拟 数据 的 最 后 一 个 示例 ， 其 理论 谱 密 度 见 图 表 13-19. 
用 单位 方差 正 态 白 噪声 模拟 一 144 个 数据 点 ， 可 视 其 为 12 年 的 月 度数 据 ， 使 用 修正 的 Daniell 


谱 窗 ， 基 于 Yn 全 12 选择 span=6, 12 和 24. 
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该 谱 富 含 细 节 ， 仅 用 144 SRE At. BR R Ba T EE, REAA 
计 根 本 就 把 季节 性 平滑 掉 了 . 置信 区 间 宽 度 (对 应 于 m=6) 似乎 证 实 了 真实 的 季节 尖峰 之 存在 . 


ER 14-17 季节 过 程 的 谱 估计 
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> win.graph (width=4.875,height=2.5,pointsize=8) 

> get.seed(247135); n=144; theta=.4;THETA=.9 

> y=arima.sim(model=list (ma=c(-theta,rep(0,10) ,-THETA, theta*THETA 
) ) ,n=n) 

spl=spec (y, spans=7, sub='',lty='dotted' ,ylim=c(.15,9), 
xlab='Frequency',ylab='Log(Estimated Spectral Density)') 

sp2=spec(y,spans=13,plot=F); sp3=spec(y,spans=25,plot=F) 

lines (sp2$freq, sp2$spec, lty='dashed') 

lines (sp3$freq, sp3$spec, 1lty='dotdash' ) 

f=seq (0.001, .S,by=.001) 

lines (f, ARMAspec (model=list (ma=-theta, seasonal=list (sma=-THETA, 

period=12)),freq=f,plot=F) $spec, lty='solid') 


V 
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图 表 14-18 显示 了 基于 最 佳 AR 模型 估计 的 谱 ， 基 于 最 小 AIC 选择 的 阶 数 为 13， 并 很 好 地 显示 
出 了 季节 性 ， 但 是 高 频 部 分 的 高 峰 有 所 错位 .观察 图 表 14-17 和 图 表 14-18， 也 许 能 得 出 如 下 结论 : 
季节 性 确实 存在 ， 并 且 在 给 定 既 有 样本 量 的 情况 下 ， 选 取 罕 的 谱 窗 能 够 给 出 对 谱 密度 最 好 的 估计 . 


图 表 14-18 季节 过 程 的 AR 谱 估 计 
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> sp4=spec(y,method='ar',ylim=c(.15,15),lty='dotted', 
xlab='Frequency', ylab='Log(Estimated AR Spectral Density) ') 

> f=seq(0.001, .5,by=.001) 

> lines (f, ARMAspec (model=list (ma=-theta, seasonal=list (sma=-THETA, 
period=12)),freq=f£,plot=F) $spec, lty='solid') 
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这 里 用 两 个 span=3 的 修正 Daniell 谱 窗 的 卷 积 作为 该 谱 最 后 的 估计 ， 见 于 图 表 14-3 中 间 
的 图 .估计 的 谱 见 图 表 14-19. 也许 这 是 所 有 例子 里 最 好 的 估计 了 . 


图 表 14-19 用 卷 积 窗 估计 季节 谱 


log (估计 的 谱 密度 ) 


> sp5=spec (y, spans=c (3,3) ,sub='',lty='dotted', 
xlab='Frequency',ylab='Log(Estimated Spectral Density)') 

> f=seq(0.001, .5,by=.001) 

> lines (f,ARMAspec (model=list (ma=-theta, seasonal=1list (sma=-THETA, 
period=12)),freq=f,plot=F) $spec, lty='solid') 


14.8 真实 数据 示例 
工业 机 器 人 
让 工业 机 器 人 完成 一 连 串 动作 ， 并 以 英寸 为 单位 ， 记 录 到 达 位 置 与 目标 位 置 间 的 距离 。 重 
复 324 次 ， 形 成 如 图 表 14-20 所 示 的 时 间 序 列 . 
图 表 14-20 工业 机 器 人 动作 结束 位 置 时 间 序 列 


结束 位 置 偏 移 值 


时 间 


ee SS eee 

> data(robot) 

> plot (robot, ylab='End Position Offset',xlab='Time') 

-一 
这 里 使 用 两 个 m=7 的 修正 Daniell 谱 窗 的 卷 积 〈 实 线 )， 并 在 每 个 序列 的 端点 进行 10% 锥 

削 ， 所 得 出 的 谱 估计 示 于 图 表 14-21. 此 谱 窗 的 图 示 见 图 表 14-3 中 间 位 置 。 对 该 谱 的 估计 采用 

一 个 拟 合 的 ARC) 模型 (虚线 )， 其 阶 数 通过 最 小 化 AIC 来 确定 . 给 定 95 为 置信 区 间 长 度 ， 


可 得 结论 如 下 : 两 个 估计 中 都 有 的 频率 0. 15 附近 的 高 峰 可 能 是 真实 的 ， 但 高 频 部 分 的 高 峰 有 
可 能 是 假 的 ， 在 极 低 的 频率 显示 出 具有 很 大 的 功率 ， 这 与 图 表 14-20 中 示 出 的 序列 具有 缓慢 深 
移 的 性 质 相 吻合 . 


图 表 14-21 工业 机 器 人 的 估计 谱 
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> spec (robot, spans=c(7,7),taper=.1,sub='',xlab='Frequency', 
ylab='Log (Spectrum) ') 

> s=spec(robot,method='ar', plot=F) 

> lines (sSfreq,s$spec,lty='dotted') 


河水 流量 
图 表 14-22 显示 了 1958 年 9 月 至 2006 年 8 月， 采样 自 艾 奥 瓦 州 瓦 佩 治 测量 的 爱 荷 华 河 的 
月 度 河 水 流量 ， 数 据 值 偏 高 情况 非常 大 ， 而 分 析 时 通过 取 对 数 则 可 大 为 改善 这 种 情 疯 . 
图 表 14-22 河水 流量 时 间 序 列 


1960 1970 | 1980 ， 1990 2000 


> data(flow); plot (flow, ylab='River Flow') 


数据 样本 量 为 576 ， 其 平方 根 是 24， 修 正 的 Daniell 谱 窗 的 带宽 约 为 0.01. 在 对 若干 谱 
窗 带宽 进行 试验 后 ， 确 定 了 这 类 谱 窗 会 过 度 平 滑 ， 因 此 改 用 两 个 该 类 窗 的 眷 积 ， 每 一 个 的 
span 二 7， 这 一 卷 积 窗 的 带宽 约 为 0.0044. 在 图 表 14-23 中 ,平滑 后 的 谱 密 度 佑 计 用 实 线 给 
出 ， 同 时 绘 出 通过 最 小 化 AIC 选取 的 基于 AR(7) 模型 的 估计 〈 虚 线 )， 频 率 1/12 上 明显 的 
高 峰 表示 出 每 年 很 强 的 季节 性 ， 在 对 应 于 基 频 1/12 倍数 的 大 约 f~0.17 和 f~0.25 E, FF 
在 较 小 的 第 二 高 峰 ， 它 们 是 年 度 频率 的 更 高 的 谐 波 . 
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FAR 14-23 流量 对 数 之 谱 对 数 


Log ( 谱 ) 
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> Spec(log(flow),spans=c(7,7),YylLlim=c(.02,13),Ssub=' '， 
ylab='Log (Spectrum) ',xlab='Frequency' ' ) 

> s=spec(log(flow) ,method='ar',plot=F) 

> lines (s$freq,s$spec,1lty='dotted') 


月 度 牛 奶 产量 

图 表 11-14 的 上 半 部 分 显示 了 美国 自 1994 年 1 月 至 2005 年 12 月 的 月 度 牛 奶 产量 情况 ， 其 
存在 一 个 伴随 季节 性 的 上 升 趋势 . 这 里 先 用 一 个 简单 的 线性 趋势 模型 去 掉 上 升 趋 势 ， 然 后 对 回 
归 后 所 得 残 差 一 一 季节 项 -一 一 进行 研究 . 试 过 若干 谱 带宽 以 后 ， 我 们 决定 用 span=3 的 两 个 修 
IE Daniell 窗 的 卷 积 ， 并 确信 不 如 此 将 导致 过 度 的 平滑 . 通过 估计 AR 谱 可 以 证 明 上 面 结论 ， 
并 最 终 拟 合成 一 个 阶 数 为 15、 在 相同 频率 上 有 高 峰 的 AR. 注意 图 表 14-24 所 示 的 高 峰 位 于 
1/12,2/12,…,6/12 等 频率 上 ， 其 中 在 1/12 上 的 功率 最 大 . 


图 表 14-24 牛奶 产量 季节 项 的 估计 谱 


> data (milk) 

> spec (milk, spans=c (3,3) ,detrend=T, sub="", 
ylab='Estimated Log (Spectrum) ',xlab='Frequency' ) 

> abline(v=seq(1:6)/12,1ty='dotted') 


以 图 表 14-25 所 示 的 时 间 序 列 为 本 节 的 最 后 示例 ， 这 两 幅 图 显示 了 长 度 分 别 为 4423 和 4417 
的 两 个 时 间 序 列 的 前 400 个 点 ， 完 整 的 序列 是 通过 录制 某 长 号 及 某 上 低音 号 演员 分 别 持续 吹奏 约 
0.4 PRE BEF CHEO 而 得 到 的 .原始 录音 生成 的 数据 以 44. 1MHz 频率 进行 采样 ， 不 过 为 分 析 
方便 ， 用 每 隔 四 个 数据 点 作 二 次 抽样 的 方法 降低 了 数据 量 . 长 号 和 上 低音 号 是 在 相同 音域 演奏 的 
铀 管乐器， 区 别 只 在 于 铜 管 的 尺寸 和 形状 .上 低音 号 的 铜 管 更 长 〈 膛 径 更 大 )， 多 是 锥 状 ， 而 次 
中 音 长 号 的 铜 管 则 多 为 柱状 ， 且 膀 径 较 小 ， 与 长 号 高 亢 、 金 属 质感 的 声音 不 同 ， 上 低音 号 的 声音 
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更 显 醇厚 .这些 音符 在 演奏 时 ， 听 上 去 很 相近 ， 问 题 是 : 铜 管 的 形状 和 尺寸 对 于 谐 波 (泛音) 的 
影响 是 否 足以 让 音 谱 上 的 差别 有 所 显现 ? 


图 表 14-25 长 号 和 上 低音 号 演奏 的 降 B 音 


长 号 Bb 
| 
pe 0 
= 
0 100 200 300 400 
时 间 
上 低音 号 Bh 7 
S I 
党 0 
-l4 
0 100 200 300 400 
时 间 


win.graph(width=4.875,height=4,pointsize=8) 
data(tbone); data(euph); oldpar=par; par (mfrow=(c(2,1))) 
trombone= (tbone-mean(tbone) ) /sd(tbone) 
euphonium= (euph-mean (euph) ) /sd (euph) 
plot (window (trombone, end=400),main='Trombone Bb', 
ylab='Waveform', yaxp=c(-1,+1,2)) 
> plot (window (euphonium, end=400),main='Euphonium Bb', 
ylab='Waveform',yaxp=c(-1,+1,2)); par=oldpar 


V Y WV Ww Y¥ 


图 表 14-26 显示 了 对 这 两 种 波形 所 估计 的 谱 ， 其 中 实 线 为 上 低音 号 的 ， 虚 线 为 长 号 的 .对 
两 个 序列 ， 均 采用 了 span=11 的 两 个 修正 Daniell 谱 窗 的 卷 积 。 因为 两 个 序列 大 体 上 长 度 相 
同 ， 所 以 带宽 都 约 为 0.0009， 且 图 中 的 带宽 /置信 区 间 十 字 准 线 几 乎 难以 察觉 . 


图 表 14-26 KS (虚线 ) 和 上 低音 号 (RR) HB 


Log 谱 线 


fe-04 le-O2 le+0Q e402 


0.0 0.1 0.2 0.3 0.4 0.5 
频率 


ee 


> win.graph (width=4.875,height=2.5,pointsize=8) 

> spec (euph, spans=c(11,11),ylab='Log Spectra', 
xlab='Frequency',sub='') 

> s=spec (tbone, spans=c(11,11),plot=F) 

> lines (s$freq,s$spec,ity='dotted') 
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先前 的 四 个 主峰 都 位 于 相同 的 频率 ， 但 在 很 远 的 高 次 谐 波 频率 上 ， 长 号 明显 地 具有 更 强 的 
谱 功 率 . 有 人 也 认为 这 正 说 明了 长 号 音质 更 质感 ， 而 上 低音 号 音质 更 和 柔和. 


14.9 其 他 谱 估 计 法 

在 快速 傅 里 叶 变 换 广 泛 运用 之 前 ， 对 样本 谱 的 计算 和 平滑 的 计算 量 极 大 一 一 对 于 长 时 间 序 
列 更 是 如 此 . 滞后 窗 估计 曾 用 来 部 分 地 降低 计算 上 的 困难 . 

滞后 窗 估计 

考虑 样本 谱 和 平滑 样本 谱 . 我 们 有 


Ss(f) = ww r+4 


= Swot ba De te mr (14. 9. 1) 


k==m 


-È P È Waeth Jers 


= prf] 


或 
Sf) = Jw (L) et” (14. 9. 2) 
其 中 
w(L) = Dwwe(*) (14. 9. 3) 
方程 (14. 9. 2) 要 求 定义 并 研究 如 下 的 一 类 谱 估计 : 
Šf) = w(t) cos(2x 方 ) (14. 9. 4) 


其 中 函数 wa) 具有 人 性质 

wlr) 一 w(— x) 

w(0) = 1 

wir)<1, |x/<1 (14. 9. 5) 
函数 w(z) 称 为 一 个 滞后 窗 ， 它 决定 了 在 每 一 滞后 处 给 样本 自 协 方差 加 多 大 的 权重 ， 


矩形 滞后 窗 定 义 如 下 : 
wix)=1, |z|<1 (14. 9. 6) 


相应 的 滞后 窗 谱 估 计 正 是 样本 谱 ， 此 估计 对 大 滞后 加 了 过 大 的 权重 ， 而 在 那里 样本 自 协 方差 数 


据点 极 少 ， 所 以 估计 是 不 可 靠 的 . 
下 一 个 最 简单 的 滞后 窗 是 截 尾 和 矩形 滞后 窗 ， 在 计算 中 对 大 滞后 采取 了 简单 丢弃 的 方法 E 


义 如 下 : 
w(+) =1, HERS (14.9.7) 
71 


这 里 计算 上 的 益处 得 自 于 把 m WAG a) F n. 
三 角 滞后 窗 或 Bartlett HEJ Bt SR te Se REAR T BETI PJE 后 的 权重 ， 定 义 如 下 : 
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w(Z) =1-[2], ilS m (14. 9. 8) 


其 他 常用 滞后 窗 和 Parzen, Tukey~Hamming 以 及 Tukey-Hanning 等 名 字 相 联系 ， 这 里 不 作 
进一步 的 讨论 ， 关 于 用 滞后 窗 方法 进行 谱 佑 计 可 从 Bloomfield (2000), Brillinger (2001), 
Brockwell 和 Davis(1991) 以 及 Priestlev(1981) 等 获得 更 多 的 信息 . 

其 他 平滑 方法 

还 有 其 他 的 平滑 样本 谱 的 方法 ，Kooperberg 等 (1995) 提出 使 用 样 条 对 谱 分 布 进行 估计 的 
Fik. Fan 和 Kreutzberger(1998) 研究 了 局 部 平滑 多 项 式 法 以 及 谱 估 计 的 Whittle 似 然 法 ， 该 
方法 用 带宽 自动 选择 来 平滑 样本 谱 ， 也 可 以 参考 Yoshihide (2006), Jiang 和 Hui (2004) 及 
Fay 4(2002). 


14.10 ”小 结 


对 于 给 定 的 样本 谱 密 度 ， 其 特征 并 非 我 们 想 要 的 ， 因 此 本 章 引 入 了 平滑 样本 谱 密 度 ， 并 证 
明了 可 对 其 适当 构造 来 改善 有 关 特 性 .本章 还 研究 了 偏差 、 方 差 、 港 露 、 带 宽 和 锥 前 等 重要 的 
主题 ， 探 讨 了 置信 区 间 的 构造 流程 ， 且 基于 真实 的 以 及 模拟 的 时 间 序 列 数据 ， 对 所 有 想法 进行 
了 了 说明. 


习题 
14.1 考虑 带 Daniell 谱 窗 的 SCM 的 方差 . 这 里 不 用 方程 (14. 2.4) ， 而 是 利用 2 S/S 通 
近 有 两 个 自由 度 之 卡 方 分 布 的 事实 ， 来 说 明 平 滑 样 本 谱 密度 具有 通 近 方差 S (有 / (2m 十 
1). 
14.2 考虑 简单 Daniell 矩形 谱 窗 的 各 种 卷 积 . 
(a) 构造 一 个 类 似 图 表 14-3 所 示 的 由 三 个 图 组 成 的 图 示 ， 但 使 用 的 是 Daniel BH. H 
m= 三 5， 中间 的 图 应 该 是 两 个 Daniell 窗 的 卷 积 ， 最 左边 的 图 是 三 个 Daniell HMR. 
(b) 4 n=100, 求 (a) 中 构造 的 每 个 谱 窗 的 带宽 和 上 自由 度 ， 
(c) 构造 另 一 个 类 似 图 表 14-3 所 示 的 由 三 个 图 组 成 的 图 示 ， 但 使 用 修正 的 Daniell 谱 
窗 ， 这 次 第 一 幅 图 令 m=5 BE, POA m=5 Am=7 两 个 的 卷 积 ， 第 三 幅 用 m 
为 5，7 和 11 三 个 窗 的 卷 积 得 到 ， 
(d) 令 n=100, R Co) 中 构造 的 每 个 谱 窗 的 带宽 和 目 由 度 . 
14.3 对 于 Daniell 矩形 谱 窗 ， 证 明 
(a) Z D BW) =a (Ft t+ F): 
对 于 任意 常数 c， 若 m Bm=cln, WK n AFE, (2) 中 表达 式 的 右边 起 
FẸ. 
(c) IHRES c, Hm=cvn. WADE (14. 2. 4) AMAA HOE ee E E 
方差 随 n BFR HBTS. 


Cb 
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HSU 的 分 布 由 某 个 有 ，* 个 自由 度 的 卡 方 随机 变量 的 倍数 来 逼近 ， 满 足 SCP) ~c. 
用 方程 (14. 2. 4) 所 给 出 的 SCA 的 渐 近 方差 以 及 SCP) 渐 近 无 偏 的 事实 ， 令 均值 与 方 
差 相 等 ， 求 c My 的 值 (这 就 建立 了 方程 (14.4.2)) . 
根据 下 面 的 表达 式 ， 构 造 一 个 长 度 n= 48 的 时 间 序 列 : 
Y, = sinL2r(0. 28)t] 
绘 出 序列 的 周期 图 并 对 其 表象 进行 解释 . 
对 洛杉矶 年 降雨 量 时 间 序 列 的 谱 进 行 估 计 ， 数 据 在 名 为 larain 的 文件 里 .因为 序列 中 存 
在 偏 斜 情况 ， 所 以 使 用 原始 降雨 数值 的 对 数 . 序列 长 度 的 平方 根 指出 span 的 值 约 为 11. 
使 用 修正 的 Daniell 谱 窗 ， 一 定 要 固定 垂直 极限 以 看 到 全 部 的 置信 区 间 引 导 . 对 估计 谱 
作出 评价 . 
名 为 spotsl 的 文件 中 有 自 1700 年 至 2005 年 共 306 年 间 太 阳 黑 子 数目 的 数据 . 
(a) 绘 出 这 些 数据 的 时 间 序 列 图 ， 此 序列 的 平稳 性 看 上 去 是 否 合理 ? 
(b) 运用 span 为 3 的 修正 Daniell 谱 窗 与 其 自身 的 卷 积 来 估计 谱 ， 并 解释 图 意 . 
(o) 应 用 通过 最 小 化 AIC 定 阶 的 AR 模型 估计 谱 ， 并 解释 图 意 ， 所 选 阶 数 是 多 少 ? 
(d) 把 (b) 和 (c) 中 得 到 的 估计 释 画 在 一 张 图 上 ， 它 们 是 否 在 一 定 合理 的 程度 上 相 
吻合 ? 
考察 艾 奥 瓦 州 迪 比 克 市 的 月 平均 气温 时 间 序 列 . 数据 在 名 为 tempdub 的 文件 里 ， 其 144 
个 数据 量 涵盖 了 自 1964 年 1 月 至 1975 年 12 月 的 记录 . 
(a) 使 用 多 种 span 取 值 的 修正 Daniell 谱 窗 估计 谱 . 
(b) 你 认为 (a) 中 哪 一 个 估计 最 好 地 表示 了 过 程 的 谱 ? 一 定 要 用 带宽 的 考虑 以 及 置信 
极限 来 支撑 你 的 论点 . 
EEG ( 脑 电 图 ) 时 间 序 列 见于 名 为 eeg 的 数据 文件 ， 脑 电 图 是 一 种 非 侵 害 性 的 检测 手 
段 ， 用 以 监测 和 记录 大 脑 产 生 的 电信 号 活动 情况 . 文件 里 的 数据 是 以 每 秒 256 的 速率 采 
样 自 某 脑 疾患 者 ， 全 部 记录 长 度 n=13 000 一 一 或 者 说 略 短 于 一 分 钟 . 
(a) 绘 出 时 间 序 列 图 ， 并 判断 平稳 性 是 否 合理 ? 
(b) 用 修正 Daniell 谱 窗 与 其 自身 的 卷 积 来 估计 谱 ， 两 个 卷 积分 量 的 span 都 是 51， 并 解 
释 图 意 . 
(c) 应 用 通过 最 小 化 AIC 定 阶 的 AR 模型 估计 谱 ， 并 解释 图 意 . 所 选 阶 数 是 多 少 ? 
(d) 把 (b) Al (co) 中 得 到 的 估计 又 画 在 一 张 图 上 ， 它 们 是 否 在 一 定 的 合理 度 上 相 吻 合 ? 
名 为 electricity 的 文件 中 有 自 1994 年 1 月 至 2005 年 12 月 美国 月 度 发 电量 的 数据 ， 这 
些 数据 取 对 数 后 绘制 的 时 间 序 列 图 见 图 表 11-14. 因为 数据 中 存在 上 升 趋势 ， 并 且 在 更 
高 等 级 上 变动 性 增 大 ， 所 以 在 下 面 进行 分 析 时 将 使 用 对 数 的 一 次 差分 . 
(a) 构造 电量 值 对 数 取 一 次 差分 后 的 时 间 序 列 图 ， 在 这 一 点 上 一 个 平稳 的 模型 看 上 去 
有 没有 保证 ? 
(b) 用 span 值 为 25、13 和 7 的 修正 Daniell 谱 窗 平滑 对 数 一 次 差分 的 谱 ， 并 解释 结果 . 
(c) 应 用 通过 最 小 化 AIC 定 阶 的 AR 模型 估计 谱 ， 并 解释 图 意 ， 所 选 阶 数 是 多 少 ? 应 用 得 
自 两 个 span=3 的 修正 Daniell 窗 之 卷 积 的 谱 窗 ， 并 使 用 10% 的 锥 前 ， 解 释 所 得 结 来 . 
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(d) 应 用 通过 最 小 化 AIC 定 阶 的 AR 模型 估计 谱 ， 并 解释 图 意 ， 所 选 阶 数 是 多 少 ? 

Ce) 把 (ce) Al (cd) 中 得 到 的 估计 个 画 在 一 张 图 上 ,它们 是 理 在 一 定 的 合理 度 上 相 
We? 

考虑 图 表 14-24 中 使 用 过 的 月 度 牛 奶 产量 时 间 序 列 ， 数 据 在 名 为 milk 的 文件 里 . 

Ca) 用 两 个 span=7 的 修正 Daniell 窗 卷 积 后 得 到 的 谱 窗 来 估计 谱 ， 并 与 图 表 14-24 中 
的 结果 进行 比较 ， 

(b) 用 一 个 span=7 的 修正 Daniell 谱 窗 来 估计 谱 ， 并 与 图 表 14-24 及 (a) 中 的 结果 进 
行 比 较 . 

(c) 最 后 用 一 个 修正 Daniel HA, span=11 估计 谱 ， 并 与 图 表 14-24 及 (a). (b) 中 
的 结果 进行 比较 ， 

(d) 在 这 四 个 不 同 的 估计 里 ， 你 偏爱 哪个 ， 为 什么 ? 

考虑 图 表 14-22 中 所 示 河 水 流量 序列 ， 在 图 表 14-23 中 有 一 个 谱 估 计 ， 数 据 在 名 为 

flow 的 文件 里 . 

(a) 取 n 二 576， 则 yn 二 24， 用 span=25 和 修正 Daniell 谱 窗 来 估计 谱 ， 并 与 图 表 14-23 
中 的 结果 进行 比较 . 

(b) 用 span=13 的 修正 Daniell 谱 窗 来 估计 谱 ， 并 将 结果 与 (a) RAR 14-23 PHA 
果 进 行 比较 ， 

名 为 tuba 的 文件 中 的 时 间 序 列 包 含 了 取 自 大 号 演奏 的 约 0.4 秒 数字 化 的 声音 数据 ， 其 

演奏 为 一 个 八 度 降 B 和 中 音 C 下 的 一 个 音 

(a) 绘 出 该 数据 集 前 400 个 点 的 时 间 序 列 图 ， 并 与 图 表 14-25 中 长 号 和 上 低音 号 的 结 
RITER. 

(b) 用 两 个 span=11 的 修正 Daniell 窗 的 卷 积 来 估计 大 号 时 间 序 列 的 谱 . 

(c) 将 (Cb) 中 所 得 估计 谱 与 图 表 14-26 中 长 号 及 上 低音 号 的 结果 进行 比较 . (你 可 能 
想 把 这 几 个 谱 重 和 要 起来. ) 记 住 大 号 比 另 两 个 乐器 的 演奏 低 一 个 八 度 . 

(d) 大 号 谱 的 高 频 分 量 更 像 长 号 的 还 是 上 低音 号 的 ? Gem: 上 低音 号 有 时 也 叫做 次 中 


BAKE!) 


附录 K FERS IRA Se ee 


te Y,=cos(2nfott+@), t=1s 2s..05 Ms 其 中 的 fo 不 必 为 傅 里 叶 频 率 . 因为 不 影响 周期 
图 ， 所 以 为 简化 起 见 ， 实 际 上 假设 


Y, = eh (14. K. 1) 
这 样 离 散 时 间 傅 里 叶 变 换 可 给 出 如 下 : 
wee ait = ae ps (14. K. 2) 
由 方程 (13.J.7) 和 (13.J.8)， 对 任意 =z, 
1S) ete luri (Ee™™ ) L olie go SET) 
n n C a D n (e — e ™) 


r=1 
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使 得 
din — ornrdef 1 sinCrnz ) 
ie = (rt De is | (14. K. 3) 
函数 
D(z) = + SinGaunz) (14. K. 4) 
n sin(nxz) 
是 图 表 14-7 左边 所 示 的 狄 利克 雷 核 ，* 王 100. 上 述 结果 可 推出 周期 图 如 下 的 关系 : 
ICf) cc |DCf— fo) |? (14. K. 5) 


应 记得 对 所 有 的 傅 里 叶 频 率 有 D(.P)=0， 因 此 该 窗 在 这 些 频 率 上 无 效 ， 当 非 傅 里 叶 频 率 上 有 相 
当 的 功率 时 会 产生 泄露 ， 现在 考虑 用 余弦 钟 对 Y, 进行 锥 前 ， 则 有 
Y, = 去 人 ee on oY = — 5 EETA ~ +e Qmifyth2mi(e-1/2)/n — eer tae yah 
(14. K. 6) 
再 进行 若干 代数 运算 后 ， 得 到 


LS e 2ni ft 


am iid ai D(f 一 J= a a Ar (14. K.7) 
pK aX 
Df) = D(f = =) + SDF fo) + P(S- fe +=) (14. K. 8) 
是 图 表 14-7 右边 绘 出 的 锥 削 或 修正 的 犹 利克 雷 核 ,n= 三 100. 锥 削 序 列 的 周期 图 与 | CI 
成 正比 ， 因 而 旁 瓣 带 来 的 问题 大 幅 减 少 了 . 
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可 以 证 明 (Wold，1948) 任意 弱 平 稳 过 程 CY.) 均 满足 Wold 分 解 ， 
Y, = U, + e, + gremi + pre F 

其 中 e SPY, 对 基于 过 去 所 有 YY 值 所 做 出 的 最 优 线 性 预测 的 偏离 量 ，{U,) 是 纯 确 定性 平稳 
过 程 ， 且 对 任意 :和 ss， 都 有 SU, 不 相关 ， 纯 确定 过 程 措 的 是 可 以 任意 精确 预测 的 过 程 ; 
( 即 均 方 误差 可 以 任意 小 ) 这 里 的 预测 指 有 限 个 党 后 项 的 线性 预测 ， 纯 确定 过 程 的 一 个 简单 例 
TEU Se ， 即 凋 数 ， 其 更 精巧 的 例子 是 前 面 介绍 的 随机 余 绽 波 模 型 本质 上 ，!{1D,) 代表 了 
数据 中 的 随机 、 平 稳 “ 趋 势 "， 预 测 误差 (e) 是 白 噪声 序列 ，e, REY, 构成 中 “新 的 ”成 分 ， 
因此 常 被 称 为 过 程 的 “新 息 ” Wold 分 解 指 出 ， 任 意 弱 平稳 过 程 都 是 一 个 〈 阶 数 可 能 无 穷 的 ) 
MA 过 程 与 某 确 定性 趋势 之 和 . 如 此 即 可 在 MA) 过 程 的 框架 下 来 计算 最 优 线 性 预测 ， 进 
而 用 有 限 阶 ARMA HEN MACE) 过 程 ， 因 而 Wold 分 解 保 证 了 平稳 过 程 预测 中 ARMA 
模型 的 可 变性 ， 

但 是 除了 方便 ， 再 没有 其 他 理由 仅仅 局 限于 线性 预测 ， 如 果 允 许 非 线性 预测 ， 并 基于 站 过 
去 的 取 值 通过 最 小 化 均 方 预测 误差 的 方法 寻求 Y, 的 最 优 预测 ， 那 么 最 优 预测 将 不 再 是 最 优 线 
性 预测 了 ， 而 是 简单 给 定 Y, 所 有 过 去 取 值 下 的 条 件 均 值 ， Wold 分 解 表 明 ， 最 优 一 步 回 前 线性 
预测 成 为 最 优 一 步 向 前 预测 的 充 要 条 件 是 ，Wold 分 解 中 的 fe.) 满足 以 下 条 件 : 给 定 过 去 的 
e, e 的 条 件 均 值 恒 等 于 0， 满足 这 一 条 件 的 fe.) 称 为 款 差 序列 ， 因 而 以 后 也 称 该 条 件 为 款 差 
条 件 ， 举 例 来 说 ， 如 果 fe.) 是 均值 为 0 的 独立 同 分 布 随 机 变量 序列 ， 则 其 满足 技 差 条 件 ， 但 
是 车 (e) 为 某 些 GARCH 过 程 时 也 会 满足 ， 尽 管 如 此 ， 当 不 满足 观 差 条 件 时 ， 非 线性 预测 会 
得 到 更 精确 的 预测 . Hannan(1973) 就 是 用 最 优 一 步 回 前 线性 预测 为 最 优 一 些 回 前 预测 来 定义 

到 目前 为 止 ， 已 讨论 过 的 时 间 序 列 模型 在 如 下 意义 上 本 质 而 言 均 为 线性 模型 : 经 适当 的 同 
期 变换 ， 一 步 向 前 条 件 均值 是 时 间 序 列 变量 当前 及 过 去 取 值 的 线性 隆 数 .如 果 像 通常 假设 的 那 
样 ， 误 差 服 从 正 态 分 布 ， 则 线性 ARIMA 模型 将 导出 一 个 正 态 分 布 的 过 程 . 实践 证 明 ， 线 性 时 
间 序 列 方法 非常 有 用 ， 但 线性 的 、 正 态 的 过 程 的 确 有 所 局 限 ， 例 如， 平稳 正 态 过 程 可 以 由 其 均 
值 和 自 协 方差 函数 完全 表征 出 来 ， 因 此 在 时 间 上 道 转 后 的 过 程 和 原 过 程 具有 相同 的 分 布 ， 这 后 
一 条 性 质 称 为 时 间 可 道 性 . 但 是 许多 实际 过 程 在 时 间 上 显示 了 不 可 道 的 特性 .， 例如， 股票 的 历 
史 日 收盘 价 通 常 是 缓慢 上 扬 的 ， 但 如 果 下 跌 ， 跌 势 却 是 陡峭 的 ， 这 显示 出 了 一 种 时 间 不 可 北 的 
数据 机 制 . 此外， 一步 向 前 条 件 均 值 可 能 是 非 线 性 的 ， 而 非 关 于 现在 与 过 去 取 值 线性 .例如 ， 
由 于 资源 有 限 的 约束 ， 动物 丰 度 过 程 可 能 是 非 线 性 的 .特别 地 ， 虽然 让 度 较 高 的 时 段 极 可 能 紧 
接着 一 个 丰 度 更 高 的 时 段 ， 但 在 丰 度 已 达 极 高 水 平 的 情况 下 ， 在 紧 随 其 后 的 时 段 内 ， 种 群 数量 
却 有 可 能 剧 降 ， 非 线性 时 间 序 列 模型 通常 展示 出 非常 丰富 的 动态 结构 ， 实 际 上 ，May(1976) 
证 明 ， 很 简单 的 一 个 确定 性 的 非 线性 差分 方程 可 以 有 以 下 意义 上 的 混沌 解 : 时 间 序 列 的 解 对 初 
始 值 敏 感 ， 且 看 起 来 基于 相关 分 析 是 难以 将 其 与 白 品 声 序 列 加 以 区 分 的 . 因此 ， 非 线性 时 间 序 
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列 分 析 也 许可 以 提供 更 精确 的 预测 ， 在 状态 空间 的 某 些 部 分 可 能 是 非常 重要 的 ， 从 而 对 所 研究 
数据 的 动态 给 出 新 颖 的 启示 ， 非 线性 时 间 序 列 分 析 的 研究 热情 大 约 源 于 20 世纪 70 年 代 后 期 对 
实际 数据 表现 出 的 非 线 性 动态 进行 建 模 的 要 求 ， 见 Tong(2007)， 除 了 某 些 情况 下 ， 对 于 观 
测 时间 序 列 的 内 在 机 制 有 成 熟 的 理论 可 用 以 外 ， 一 般 的 非 线性 数据 机 制 都 是 未 知 的 ， 因此， 
实证 非 线 性 时 间 序 列 分 析 的 基本 问题 之 一 关注 的 是 如 何 选取 一 般 的 非 线 性 模型 类 这里， 我 
们 的 目标 不 太 高 ， 向 大 家 介绍 非 线 性 时 间 序 列 模型 中 最 重要 的 模型 之 一 一 一 门限 模型 ， 对 非 
线性 时 间 序 列 分 析 和 混沌 感 兴 趣 的 话 ， 可 以 参考 Tong(1990) 以 及 Chan 和 Tong(2001) 系 
统 的 介绍 . 


15. 1 用 图 解法 探索 非 线 性 


在 ARIMA 建 模 中 ， 新 息 (误差 ) 过 程 通常 设 定 为 服从 独立 同 分 布 的 正 态 分 布 ， 这 一 正 态 
误差 假设 意味 着 平稳 时 间 序 列 同时 也 是 正 态 过 程 ， 即 时 间 序 列 观 测 的 任意 有 限 集合 服从 联合 正 
Aarti. Ha Yo Yo 对 具有 二 元 正 态 分 布 ， 从 而 任何 Y 的 二 元 对 都 如 此 ; (Yis Yo, Yad 
三 元 组 具有 三 元 正 态 分 布 ， 从 而 任何 Y 的 三 元 组 皆 然 ， 依 次 类 推 。 当 数据 不 服从 正 态 分 布 时 ， 
可 在 数据 上 应 用 ACY, 形式 的 同期 变换 ， 例 如 ACY,)= VY,， 以 期 使 用 正 态 ARIMA 模型 可 以 
很 好 地 逼近 待 研究 的 数据 生成 机 制 ， 在 作 统 计 推 断 时 ， 采 用 正 态 假设 主要 是 为 了 方便 . 实际 当 
中 ， 可 能 要 考虑 具有 非 正 态 新 息 的 ARIMA 模型 , 事实 上 此 类 过 程 的 动态 特性 丰富 ， 有 时 甚至 
是 奇异 的 ， 见 Tong(1990)， 若 维持 正 态 误差 假设 ， 则 非 线性 时 间 序 列 通常 为 非 正 态 分 布 ， 因 
此 ， 对 于 非 线 性 的 考察 ， 可 通过 检验 时 间 序 列 观测 的 任意 有 限 集合 是 否 服从 联合 正 态 分 布 来 进 
行 ， 例 如 , 的 二 元 对 的 两 维 分 布 是 否 为 正 态 的 . 这 一 点 可 通过 绘 出 Y, MY. MAY, 2 
点 图 予以 检验 ， 依 次 类 推 . 二 元 正 态 分 布 的 散 点 图 应 该 与 距离 中 心 越 远 密 度 越 低 的 梵 图形 数据 
云 相 似 ， 若 异 于 这 个 模式 〈 例 如 ， 数 据 云 中 存在 大 洞 )， 则 有 可 能 表明 数据 是 非 正 态 的 ， 而 相 
关 的 过 程 是 非 线性 的 ， 

图 表 15-1 RET Y, 对 其 1 至 6 阶 滞后 的 散 点 图 ， 模 拟 数 据 得 自 ARIMA(2，1) 模型 

Y, = 1. 6Y,, — 0. 94Y-2 + e, 一 0.64e (15.1.1) 
其 中 新 息 服 从 标准 正 态 分 布 ， 注意 散 点 图 中 的 数据 云 大 致 是 椭圆 形 的 ， 

在 每 个 散 点 图 中 画 出 拟 合 的 非 参 数 回归 线 ， 有 利于 展示 响应 与 其 计 后 项 之 间 的 关系 ， H 
如 ， 在 Y, 对 科 _， 的 散 点 图 中 ， 可 将 给 定 Y FY, 条 件 均值 函数 的 非 参 数 估计 量 全 加 上 去 ， 后 者 
也 称 为 1 阶 灌 后 回归 函数 ，( 特 别 地 ， 作 为 y 的 函数 ，1 阶 沾 后 回归 函数 等 于 om (WE, |Y 5 
y). ) 如 果 所 研究 的 过 程 是 线性 正 态 的， 真实 的 1 阶 滞后 回归 函数 必 是 线性 的 ， 因 而 可 预期 其 
非 参数 估计 接近 于 一 条 直线 ， 另 一 方面 ，1 阶 滞后 回归 估计 曲线 弯曲 可 能 说 明 所 研究 的 过 程 大 
非 线性 的 ， 类 似 地 ， 可 以 将 2 阶 沾 后 回归 函数 ( 即 给 定 Y,- =y R Y, 的 条 件 均值 ) 作为 y 的 
函数 以 及 更 高 阶 的 滞后 来 进行 探讨 ， 当 明显 偏离 线性 时 ， 要 选取 与 数据 相符 的 恰当 的 非 线 性 模 
型 ， 有 望 通过 这 些 回归 函数 的 形状 获得 若干 线索 ， 注 意 ， 图 表 15-1 中 的 所 有 满 后 回归 曲线 者 
相当 地 直 ， 这 表明 所 研究 的 过 程 是 线性 的 ， 恰 如 已 知 的 那样 
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图 表 15-1 对 模拟 ARMA (2, 1) 过 程 的 滞后 回归 图 . 实 线 是 拟 含 的 回归 曲线 
1 阶 识 后 回归 图 


-6 -4 -2 0 2 


win.graph (width=4.875, height=6.5,pointsize=8) 


be 

> set.seed (2534567); par(mfrow=c(3,2)) 

> y-arima.sim(n=61,model=list (ar=c(1.6,-0.94),ma=-0.64) } 
> lagplot (ył 


下 面 用 一 个 实际 例子 来 说 明 绘制 滞后 回归 图 的 方法 图表 15-2 画 出 了 一 个 实验 时 间 序 列 啊 应 ， 
是 35 天 期 间 每 隔 12 小 时 对 单位 毫升 中 个 体 〈 双 环 榜 毛 虽 ， 一 种 原生 动物 ) 数目 的 测量 但 ， 风 
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Veilleux(1976), Jost 和 Ellner(2000)， 该 实验 研究 了 捕食 系统 里 种 群 数量 波动 的 问题 ， 捕 饵 是 双人 小 
核 草 履 中 ， 一 种 单 细 胞 纤毛 虫 原生 动物 ， 而 捕食 物种 是 双环 榜 毛 让， 数据 的 初始 部 分 由 于 有 瞬 态 效 应 
貌似 非 平稳 的 ， 可 以 看 出 序列 的 上 升 阶段 一 般 比 下 降 阶 段 要 长 ， 说 明 该 时 间 序 列 是 时 间 不 可 逆 的 . 
下 面 的 分 析 忽略 前 14 个 数据 ， 即 只 用 到 图 表 15-2 中 实 线 部 分 的 〈 经 对 数 变换 的 ) 数据 . 


图 表 15-2 ”对 数 变换 的 捕食 者 数目 .时 间 序 列 的 平稳 部 分 用 实 线 表示 . 实心 圆 点 表明 
数据 位 于 一 个 拟 合 门限 自 回归 模型 的 下 部 


logt 捕 食 者 ) 


> data(veilleux); predator=veilleux([,1] 
> Win.graph (width=4.875,height=2.5,pointsize=8) 
> plot (log (predator) ,lty=2,type='o',xlab='Day', 

ylab='Log (predator) ') 
> predator.eq=window (predator, start=c{7,1))} 
> lines (log(predator.eq) ) 
> indexl=zlag (log (predator.eq) ,3)<=4.661 
> points (y=log(predator.eq) [index1] , (time (predator.eq)) [index1], 

pch=19) 
ee ee eee ee 

图 表 15-3 是 捕食 者 序列 的 滞后 回归 图 ， 注意 到 有 几 个 散 点 图 的 中 心 存 在 大 洞 ， 表 明 数 据 
必 为 非 正 态 的 ， 另 外 ， 对 2 阶 至 4 阶 滞后 的 回归 函数 的 估计 显 出 了 很 强 的 非 线 性 ， 表 明了 非 线 
性 的 数据 机 制 ; 事实 上 ， 直 方 图 CRB) 表明 序列 是 双 峰 的 ， 

下 面 详 述 如 何 用 非 参 法 估计 回归 曲线 ， 对 技术 细节 不 感 兴趣 的 读者 可 跳 过 此 节 . 具体 起 见 ， 
假设 欲 估 计 1 阶 沼 后 回归 函数 ，( 可 以 直接 推广 到 其 他 阶 数 . 1 阶 滞后 回归 函数 的 非 参 估计 通常 
的 思路 是 对 1 阶 滞后 值 接近 y 的 那些 Y 进行 平均 ， 从 而 来 估计 条 件 均 值 m (y) = EY, |Y,- =). 
显然 ， 通 过 对 1 阶 滞后 接近 y 的 了 赋予 更 大 的 权重 ， 可 使 平均 更 精确 .权重 通常 用 某 些 概率 密 
度 函 数 &Cy) 系统 地 赋值 ， 带 宽 参 数 ASO. MPM (Y. Y) RE 

fk (=>) (15.1. 2) 
仿 后 假设 k(，〉 是 标准 正 态 概率 密度 函数 ， 因 此 方程 15.1.2) 右边 是 均值 y、 方 差 h 的 正 
态 概率 密度 函数 .最 后 ， 定 义 Nadaraya- Watson {hit Be 


© Si, Nadaraya (1964) 和 Watson (1964) . 
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图 表 :15-3 捕食 者 序列 滞后 回归 图 
1 阶 澡 后 回归 图 2 阶 灌 后 回归 图 
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Sit i Ja EE 4 阶 请 后 回归 图 


go 
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5 阶 滞后 回归 图 6 阶 滞后 回归 图 
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> win.graph (width=4.875,height=6.5,pointsize=8) 
> data (predator .eq) 
> lagplot (log(predator.eq)) # libraries mgcv and locfit required 


mo (y) = 三 一 一 (15. 1. 3) 


.( 到 后 面 会 清楚 上 标 0 的 含义 . ) 鉴于 正 态 概率 密度 函数 偏离 均值 超过 3 个 标准 差 的 值 均 可 忽略 
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不 计 ，Nadaraya- Watson 估计 量 本 质 上 是 对 Y,_1 距 yy 在 3h 个 单位 内 的 那些 Y, 进行 平均 ，1 
滞后 值 越 接 近 y 的 观测 量 其 权重 越 大 ， 必 须 设 定 带宽 ， 才 能 应 用 1 阶 注 后 回归 函数 的 Nada- 
raya- Watson ftit. ME hh 有 包括 交叉 验证 法 在 内 的 多 种 方法 . 但 就 探析 和 而 言 ， 总 会 用 某 个 
缺 省 的 带宽 值 ， 并 对 之 做 些微 的 变化 ， 来 感性 认识 1 阶 洁 后 回归 函数 的 形状 . 

通过 假设 回归 函数 可 局 部 地 用 线性 函数 很 好 地 并 近 ， 可 以 得 到 一 种 更 有 效 的 非 参 估计 量 ; 
见 Fan 和 Gijbels(1996). 在 y 处 ,1 阶 沾 后 回归 函数 的 局 部 线性 估计 量 等 于 mi”"(y) 二 b。， 这 
是 通过 对 局 部 加 权 残 差 平 方 和 最 小 化 得 到 的 : 


Sw CY, — bo — h Y1)? (15. 1. 4) 
1=2 


EWES WHS, KERAP O) 的 上 标 上 代表 了 局 部 多 项 式 的 阶 数 . 通常 ， 数 据 并 非 均 
匀 分 布 ， 此 时 单一 带宽 可 能 效果 不 佳 . 作为 替代 ， 与 数据 密度 相 联 系 的 可 变 带 宽 也 许 更 为 有 
效 . 一 种 简单 的 方案 是 紧邻 方案 ， 即 改变 窗 宽 以 保证 其 覆盖 最 接近 窗 体 中 心 的 数据 之 固定 部 
分 ， 这 里 对 所 有 呈现 的 滞后 回归 图 均 设 定 该 部 分 的 比例 是 70%. 

局 部 多 项 式 方法 假设 了 真实 1 阶 汪 后 回归 函数 为 光滑 函数 ， 牢 记 这 一 点 很 重要 ， 如 果真 
实 1 阶 滞后 回归 函数 不 连续 ， 那 么 用 局 部 多 项 式 方 法 所 得 估计 可 能 有 所 误导 . 但 是 ， 佑 计 的 
回归 函数 中 若 存在 突然 的 转折 ， 则 可 作为 以 下 事实 的 预警 ， 即 真实 1 阶 回归 函数 的 平滑 条 件 
可 能 不 成 立 . 


15.2 非 线性 检验 

在 时 间 序 列 分 析 中 ， 提 出 了 若干 用 于 建立 非 线 性 模型 必要 性 评估 的 检验 方法 ， 其 中 某 些 检 
验 ， 诸 如 已 在 Keenan(1985)、Tsay(1986) Æ Luukkonen “ (1988) 中 有 所 研究 的 ， 可 归 为 
用 于 特定 非 线 性 可 选 方案 的 拉 格 朗 日 梯子 检验 . 

类 似 于 Tukey 的 单 自由 度 非 可 加 性 检验 CL Tukey, 1949), Keenan (1985) 推导 出 一 个 
非 线性 检验 ， 源 自用 如 下 二 阶 Volterra 展开 (Wiener，1958) 来 逼近 非 线 性 平稳 时 间 序列 


Y, =at 3) eet Di D Outre 5.2.19 

其 中 {e,, —oo<i<co} 是 均值 为 0 的 独立 同 分 布 随机 变量 序列 . 如 果 (15. 2. 1) 右边 的 二 
重 和 渐 趋 为 0， 则 过 程 {Y,} 是 线性 的 ， 因 此 ， 可 以 通过 检验 双重 和 是 否 趋 0 来 检验 时 间 序 
列 是 否 线性 ， 实 用 时 ， 无 穷 级 数 的 展开 需要 截断 成 有 限 的 和 . > {了 es Y) 表示 观测 . 
Keenan 检验 可 如 下 施行 : 

O AY. o> YoY, 建立 回归 模型 ， 包括 截 距 项 ， 其 中 m 是 预先 设 定 的 正 整 数 . 
对 t= 二 =m 十 1，…，n， 计 算出 拟 合 值 (F) MRE (2). CRB EAA RSS= der. 

Gi) AY... cs Yi tY? 建立 回归 模型 ， 包括 截 距 项 ， 对 1 二 m 十 1，…，n， 计 算 残 差 
LEN 

(iii) 对 三 mL1，…，mz， 用 残 差 &E 对 人 进行 回归 ， 不 包括 截 距 项 ， 以 (n 一 2m 一 2)/ (n 一 m 一 1) 
乘 以 用 于 检验 最 后 一 个 回归 函数 恒 为 0 的 下 统计 量 ， 得 到 Keenan 检验 统计 量 ， 用 表示 ， 特 别 地 ， 令 
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1 一 1o | 2 Ë (15, 2.2) 
+ 一 而 十] 
其 中 办 是 回归 系数 .构造 检验 统计 量 
PP y(n — 2m — 2) 
F RSS — y (15. 2. 3) 


在 线性 零 假设 下 ， 检 验 统 计量 FF 近 似 服从 自由 度 是 1 和 mn 一 2m 一 2 的 下 分 布 . 
Keenan 检验 可 以 司 发 式 地 推导 如 下 .考虑 下 面 的 模型 : 


Y, =O HAY i to + bn Yom + exp | 区 > 7 i) }+e (15. 2. 4) 


其 中 {se,} 是 0 均值 和 有 限 方差 的 独立 正 态 分 布 ， 如果 ww 二 0， 指 数 项 等 于 1， 可 并 作 截 中 项 ， 
因此 前 述 模型 就 成 了 一 个 ARGn) 模型 。 男 一 方面 ， 对 非 零 的 mw， 前 述 模 型 是 非 线 性 的 ， 使 用 
展开 exp(zJs*1 十 工 ， 当 工 较 小 时 近似 成 立 ， 可见 对 较 小 的 7 Y, 近 似 满 足 二 次 型 AR 模型 : 


Y, = h HIER Y a 十 和 十 加 Ye 十 下 Sara) ors (15. 2. 5) 


这 是 一 个 受 限 线性 模型 ， 最 后 的 协 变量 是 线性 部 分 AY :十 … 十 如 Y-。 的 平方 ， 在 零 假 设 下 ， 
用 拟 合 值 辫 (AR. Keenan 检验 等 价 于 在 多 元 回归 模型 中 (常数 1 并 人 0,) 检验 人 0; 
二 名 十 和 十 和 YY +9 ¥; te (15. 2. 6) 

可 以 通过 本 节 开 始 部 分 所 描述 的 方式 进行 ， 注 意 只 有 在 n 宇 t 宇 m 十 1 时 拟 合 值 才 存在 . Keenan 
检验 和 用 来 检验 是 否 有 ?一 0 的 下 检验 完全 一 样 。 借 助 拉 哥 朗 日 乘 子 检验 是 一 个 更 正式 的 方法 ， 
见 Tong(1990). 

Keenan 检验 在 概念 和 计算 上 都 很 简单 ， 且 只 有 一 个 自由 度 ， 因 此 对 于 小 样本 非常 有 用 ， 
但 Keenan 检验 仅 在 识别 线性 条 件 均值 函数 通 近 的 平方 形式 中 的 非 线性 方面 功能 强大 ， 通 过 考 
虑 更 一 般 的 非 线性 备 择 假设 ，Tsay(1986) 推广 了 Keenan 的 方法 ， 更 一 般 的 非 线 性 备 择 假设 
可 以 构造 如 下 ， 符 换 下 列 项 


j=] 


exp | (XHY) | (15. 2.7) 


+ åa Y ta + åra Y Y aa te tabi m Yea Yen (15. 2. 8) 
FB bate Ye + de Ye Ve F dae Ym Oe 
(ti AGRE exp(z)<*1 十 zx， 看 出 非 线性 模型 渐 近 是 一 个 二 次 AR 模型 ， 但 二 次 项 的 系数 现在 是 
无 约束 的 ，Tsay 检验 等 价 于 考虑 下 面 的 二 次 回归 模型 : 
Y, = Oo +MY Hohn Yim 
+ BY 1 十 BY Yee 二 we oe T i1 ee 
+ § 2¥7%. + dea Fee Yea beet tee Peete to 
Gite Ve wet Oat eet me Oe oe TE. 
检验 所 有 m(m 十 1)/2 个 系数 8 是否 都 等 于 零 . 这 里 依然 可 以 通过 检验 前 面 方 程 中 所 有 6.. 等 


expli Yi F iY Yt TT) | 


Ses a, 
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于 0 的 下 检验 来 完成 ， 作 为 拉 格 闭 日 梯子 检验 的 Tsay 检验 ， 其 严谨 的 推导 见 Tong(1990). 

现在 基于 两 个 实际 的 数据 集 来 说 明 这 些 检验 ， 在 第 一 个 应 用 中 ， 所 用 数据 是 自 1945 年 至 2007 
年 ， 年 上 度 美国 (相对 ) 太阳 黑子 的 数量 ， 是 对 观测 网 测量 到 的 太阳 活动 的 加 权 平 均 。 历史 上, AK 
昌 黑 子 数 是 太阳 表面 可 见 的 、 独 立 斑 点 以 及 斑点 群落 计数 的 某 种 加 权 和 .太阳 黑子 数 反 映 了 太阳 活 
动 的 强度 .下 面 的 太阳 黑子 数据 已 经 过 开 方 变换 ， 其 更 接近 正 态 分 布 ， 见 图 表 15-4， 时 间 序 列 图 显 
示 出 太阳 黑子 序列 具有 上 升 速 度 大 于 下 降 速 度 的 趋势 ， 说 明 数 据 是 时 间 不 可 逆 的 . 


图 表 15-4 年 美国 相对 太阳 黑子 数 
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> win.graph (width=4.875,height=2.5,pointsize=8) 

> data (spots) ` 

> plot (sqrt (spots) ,type='o',xlab='Year', 
ylab='Sqrt Sunspot Number') 


为 了 进行 非 线 性 检验 ， 必 须 确定 自 回 归 模 型 的 阶 数 m。 在 过 程 是 线性 的 零 假 设 下 ， 可 用 基 
些 信息 准则 ， 例 如 AIC， 来 确定 阶 数 ， 就 太阳 黑子 数据 而 言 ， 基 于 AIC 确定 m 一 5.。Keenan 和 
Tsay 检验 都 拒绝 线性 假设 ， 户 值 分 别 是 0.0002 和 0. 0009. 

第 二 个 例子 考虑 前 节 所 述 捕食 者 数据 序列 .得 出 所 用 AR 模型 阶 数 为 4 Keenan 和 Tsay 
检验 都 拒绝 线性 假设 ，z 值 分 别 是 0. 00001 和 0.03， 与 前 述 滞后 回归 图 所 得 到 的 推断 一 致 . 

还 有 其 他 的 检验 ， 例 如 Brock, Deckert 和 Seheinkman(1996) 基于 混沌 理论 中 的 概念 所 提出 的 
BDS 检验 ， 以 及 White(1989) 为 检验 “被 忽略 的 非 线 性 ”而 提出 的 神经 网 络 检 验 . 近期 对 非 线性 检 
验 的 回顾 ， 见 Tong(1990) 以 及 Granger 和 Terisvirta (1993) . 后 面 还 会 再 介绍 男 一 种 检验 . 


15.3 多 项 式 模型 一 般 是 爆炸 性 的 


在 非 线性 回归 分 析 中 ， 有 时 会 用 到 高 次 多 项 式 回归 模型 ， 即 使 其 迅速 膨胀 到 无 穷 大 的 特性 决定 

了 在 作 外 推 时 无 法 使 用 这 类 模型 ， 正 是 由 于 这 个 原因 ， 多 项 式 回归 模型 的 实际 应 用 很 有 限 ， 基 于 同 

样 的 原因 ， 对 多 项 式 时 间 序 列 模 型 在 预测 上 的 期 望 值 也 不 高 ， 事 实 上 ， 次 数 高 于 1 且 具 有 高 斯 误差 

的 多 项 式 时 间 序 列 模型 毫 无 例外 都 是 爆炸 性 的 ， 为 了 解 这 一 点 ， 考 虑 下 面 简单 的 二 次 ARG) 模型 . 

Y, = $Y} +e, (15.341) 

其 中 (e) 是 独立 同 分 布 标准 正 态 随机 变量 ， 令 >00, Ac 是 大 于 3/ 的 足够 大 的 数 . WR Y >c 

(因为 误差 服从 正 态 分 布 ， 该 事件 可 以 正 的 概率 发 生 )， 那 么 Y2>3Yi te. Alt ¥.>2c 的 概率 非 0. 

仔细 的 概率 分 析 可 证 ， 二 次 ARC) 过 程 满足 不 等 式 立 二 2c， 其 中 三 1，2，3，…， 概 率 为 正 ， 从 
而 会 膨大 至 无 穷 ， 事 实 上 ， 具 有 正 态 误差 的 二 次 AR(1) 过 程 以 概率 1 趋 于 无 穷 . 
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作为 例子 ， 图 表 15-5 示 出 了 一 个 $= 二 0.5 量具 有 标准 正 态 误差 的 二 次 AR) 模型 的 实现 ， 
在 上 = 一 15 时 ， 开 始 癌 无 穷 起 跳 . 

注意 二 次 AR(1) 过 程 只 有 达到 充分 大 的 值 以 后 才 会 爆炸 ， 如果 系数 几 比 较 小 ， 二 次 ARO) 
过 程 将 需要 更 长 的 时 间 才 会 向 无 穷 起 跳 ， 虽然 正 态 误差 很 少 取 任 意 大 的 值 ， 而 一 旦 出 现 ， 过 
程 必 然 会 爆炸 . 因此 ， 任 何 无 界 的 噪声 分 布 都 必然 导致 二 次 ARC) 模型 的 爆炸 性 ，Chan 和 
Tong(1994) 进一步 证 明 ， 任 何 次 数 大 于 1 且 次 数 有 限 而 品 声 分 布 无 界 的 和 多项式 自 回归 过 
程 ， 皆 具有 真实 的 爆炸 性 行为 . 


图 表 15-5 ”模拟 的 二 次 AR (1) 过 程 ， 由 =0.5 


> set.seed (1234567) 
> plot (y=qar.sim(n=15,phil=.5,sigma=1) ,x=1:15,type='0o', 
ylab=expression(Y[t]),xlab='t') 


有 趣 的 是 ， 误 差 有 界 的 多 项 式 自 回归 模型 可 能 有 平稳 的 分 布 ， 因 而 可 用 于 非 线 性 时 间 序 列 
数据 的 建 模 ， 见 Chan 和 Tong(1994)， 例 如 ， 图 表 15-6 显示 了 下 述 确定 性 逻辑 映射 的 时 间 序 
wile, BD Y,—3.97Y,.,C1—-Y,.1), t=2, 3, =, PAY: =0. 377. 相应 的 样本 ACF 示 于 图 表 
15-7， 除 轻 度 显著 的 4 阶 滞后 外 ， 其 与 白 噪 声 非 常 相像 . 注意 ， 初 值 充分 大 的 逻辑 映射 的 解 将 
迅速 膨胀 至 无 穷 . 


图 表 15-6 上 有 具有 参数 3.97 MIE Yi =0. 377 HERRERA 


| 


t 


> y=qar.sim(n=100, const=0.0,phi0=3.97,phil=-3.97,sigma=0, 
init=.377} l 
> plot (x=1:100,y=y,type='1', ylab=expression(Y[t]),xlab='t') 
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图 表 15-7 逻辑 时 间 序 列 的 样本 ACF 


> actly) 


但 是 ， 对 噪声 分 布 有 界 这 一 平稳 多 项 式 自 回 归 模 型 存在 的 必要 条 件 ， 其 边界 取 值 会 随 模 型 
的 参数 及 初 值 的 变化 而 变 ， 从 而 极 大 地 将 建 模 工 作 复杂 化 ， 因 此 多 项 式 模型 将 不 用 在 时 间 序 列 
分 析 中 . 


15.4 一 阶 门限 自 回归 模型 


上 节 讨 论 中 提出 了 一 个 重要 的 见解 ， 即 为 使 非 线 性 时 间 序 列 模型 平稳 ， 它 必须 或 者 是 线性 
的 ， 或 者 其 尾部 净 近 线性 ， 从 这 个 角度 说 ， 分 段 线性 模型 ( 即 广 为 人 知 的 门限 模型 构成 了 最 
简单 的 一 类 非 线 性 模型 .事实 上 ， 在 Tong(1978，1983，1990) LAR Tong 和 Lim(1980) 的 里 
程 碑 式 著作 中 ， 完 美 记述 了 非 线 性 时 间 序 列 分 析 中 门限 模型 的 用 途 ， 并 引致 在 不 同 领域 中 迄今 
不 训 的 理论 创新 与 应 用 以 及 广 沁 的 研究 文献 . 

门限 模型 的 识别 要 求 设 定 线性 子 模型 的 数目 并 确立 子 模型 的 运行 机 制 ， 因此， 门限 模型 存 
在 诸多 变种 ， 这 里 主要 讨论 Tong(1990) 提出 的 双 区 域 自 激 励 门限 自 回 归 模 型 (SETAR)， 其 
两 个 线性 子 模型 之 间 的 转换 仅 依 赖 于 门限 变量 的 位 置 ，SETAR 模型 〈 下 面 简称 为 TAR 模型 ) 
中 ， 门 限 变 量 是 过 程 本 身 的 某 个 灌 后 变量 ， 这 就 是 自 激励 的 由 来 . (更 一 般 地 ， 门 限 变 量 可 以 
是 某 些 向 量 协 变量 过 程 ， 甚 或 是 某 些 潜 在 过 程 ， 但 这 里 就 不 讨论 这 些 扩展 了 . ) 收 束 一 下 思路 ， 
考虑 如 下 1 阶 TAR 模型 
= $1.0 十 加 Yi 十 oe Yes <r 
7 Soo thei. oe Y-i >r 
其 中 外 是 自 回 归 参 数 ，c 是 噪声 标准 差 ，r 是 门限 参数 ，{e}) 是 0 均值 、 单 位 方差 的 独立 同 分 
布 随机 变量 序列 . AE. WE Y, 的 1 AKO, BRAY, 的 条 件 分 布 与 截 距 是 由 
自 回 归 系 数 是 贞 , 且 误差 方差 为 只 的 AR(1) 过 程 相同 ， 这 时 称 第 一 个 AR(1) 子 模型 在 运行 . 
另 一 方面 ， 当 六, 的 1 阶 滞后 值 洪 出 门限 > 时 ， 则 具有 参数 Choe bear 02) 的 第 二 个 ARC) 
过 程 在 运行 ， 故 随 着 过 程 的 1 阶 滞后 值 位 置 的 变化 ， 该 过 程 在 两 个 线性 机 制 之 间 跳 转 ， 当 1 阶 
滞后 取 值 未 达 门 限时 ， 称 过 程 位 于 下 (第 一 ) 区 域 ， 否 则 称 其 位 于 上 区 域 . 注意 在 两 个 区 域 上 
误差 方差 不 必 相 等 ， 因 此 TAR 模型 可 用 以 解释 数据 中 的 某 些 条 件 异 方差 性 . 

作为 一 个 具体 的 例子 ， 由 下 面 的 一 阶 TAR 模型 来 模拟 数据 : 


(15. 4. 1) 


i 
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"N L 5Y, ters Y,,<-1 oe 
\— 1. 8Y t 2e, Ym > 一 1 

图 表 15-8 给 出 容量 ”== 100 的 模拟 数据 时 间 序 列 图 ， 该 图 值得 关注 的 一 个 特征 是 ， 时 间 序 列 有 
某 种 周期 性 ， 表 现 为 序列 急 下 下 降 而 上 升 相对 缓慢 的 非 对 称 周期 ， 这 种 非 对 称 性 意味 着 ， 如 果 
逆转 时 间 方 向 ， 则 过 程 的 概率 结构 将 有 所 不 同 ， 明晰 此 点 的 一 种 方法 是 ， 做 出 一 张 透明 的 时 间 
序列 图 ， 将 其 翻转 并 观察 时 间 逆 向 后 的 样子 ， 这 时 ， 模 拟 数 据 在 逆转 的 时 间 上 将 会 迅速 上 升 而 
Be TR. 前面 说 过 这 种 现象 即 为 所 谓 的 时 间 不 可 逆 。 对 于 平稳 高 斯 ARMA 过 程 而 言 ， 时 间 
道 向 后 保持 不 变 的 一 阶 和 二 阶 和 矩 决定 了 其 概率 结构 ， 因 此 过 程 必 为 时 间 可 逆 的 .对 许多 实际 的 
时 间 序 列 ， 例 如 捕食 者 序列 及 相对 太阳 黑子 序列 ， 看 上 去 是 时 间 不 可 道 的 ， 揭 示 了 相关 的 过 程 
是 非 线 性 的 ， 图 表 15-9 显示 了 模拟 数据 的 正 态 得 分 QQ 图 ， 尽管 误差 服从 正 态 分 布 ， 该 图 仍 
显示 了 模拟 数据 的 分 布 具 有 比 正 态 分 布 更 厚 的 尾部 . 


图 表 15-8 ”模拟 的 一 阶 TAR 过 程 


> set.seed (1234579) 

> y=tar.sim(n=100, Phil=c(0,0.5),Phi2=c(0,-1.8),p=1,d=1,sigmal=1, 
thd=-1, sigma2=2) $y 

> plot (y=y,x=1:100,type='o',xlab='t',ylab-expression(¥Y [It})) 


图 表 15-9 ”模拟 TAR 过 程 的 正 态 QQ 图 


> win.graph(width=2.5,height=2.5,pointsize=8) 
> qqnorm(y); qqline(y) 


上 区 域 子 模型 的 自 回归 系数 等 于 一 1.8， 从 线性 角度 看 也 许 出 乎 意料 的 是 ， 模 拟 数据 看 似 
平稳 ， 因 为 若 自 回归 系数 绝对 值 大 于 1，AR(1) 模型 不 可 能 是 平稳 的 .考虑 任 一 区 域 都 没有 
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噪声 项 的 情况 ， 即 a 二 a; 二 0， 可 能 更 利于 理解 这 个 谜团 .如 此 定义 的 确定 性 过 程 称 为 TAR 模 
型 的 骨架 ， 下 面 证 明 对 任意 的 初 值 ， 该 骨架 最 终 为 一 有 界 过程 ; TAR 模型 之 平稳 正 是 基于 骨 
架 的 稳定 性 ， 对 骨架 最 终 有 界 的 详细 证 明 不 感 兴趣 的 读者 可 以 跳 到 下 一 段落 . 令 初 值 w WHE 
个 大 数 ， 比 如 10， 位 于 上 区 域 . 这 样 ， 下 一 个 值 是 y; = 二 (一 1. 8) X10= 一 18， 落 在 下 区 域 ， 因 
此 第 三 个 值 等 于 y =0.5X(—18)=—9. 由 于 第 三 个 值 在 下 区 域 ， 第 四 个 值 等 于 y =0.5X 
(一 9) 三 一 4. 5， 仍 在 下 区 域 ， 因 此 第 五 个 值 等 于 ys = 二 0.5X (一 4.5) 二 一 2.25。 显 然 数 据 一 旦 
进入 下 区 域 ， 再 次 迭代 后 值 将 减 半 ， 此 过 程 将 持续 到 未 来 的 某 次 迭代 穿越 门限 一 1， 本 例 即 在 
y: =— 0. 5625 时 出 现 . 这 时 按 第 二 个 子 模型 运行 ， 因 此 ys 二 (一 1.8)X( 一 0. 5625) =1. 0125, 
Ff A ys =(—1. 8) X1.0125=—1. 8225， 再 次 进入 下 区 域 ， 综 上 所 述 ， 若 某 次 迭代 值 落 到 下 区 
域 ， 对 它 取 半 即 得 出 下 一 步 迭 代 值 ， 直 至 未 来 的 某 次 迭代 值 大 于 一 1， 男 一 方面 ， 若 茶 次 迭代 
值 大 于 1， 则 下 步 迭 代 必 小 于 一 1， 从 而 落 和 人 下 区 域 ， 例 行 分 析 即 可 检验 过 程 最 终 会 陷于 一 1 和 
1. 8 之 间 ， 因 此 是 一 个 有 界 的 过 程 . 

在 某 种 意义 上 有 界 骨 架 是 稳定 的 . Chan 和 Tong (1985) 证 明 ， 在 某 些 温和 的 条 件 下 ， 如 
果 骨 架 稳定 ， 则 TAR 模型 渐 近 平稳 . 实际 上 上， 骨架 稳 定 加 上 某 些 正则 条 件 意味 着 遍历 性 这 个 
更 强 的 性 质 ; IRM PR. SERRA AR RP RAY Gh BAR 
数 时 成 立 )， 


ls g 
z hY.) (15. 4. 3) 


收敛 到 h(Y,) 的 平稳 均值 ， 该 值 根 据 平 稳 分 布 计算 得 到 ， 参考 近期 Cline 和 Pu(2001) 对 稳定 
性 与 遍历 性 之 间 联 系 的 综述 ， 其 中 亦 给 出 了 在 联系 有 可 能 不 成 立时 的 反例 . 
事实 上 ，TAR 模型 的 遍历 性 可 由 一 个 关联 骨架 的 稳定 性 推断 得 到 因此 骨架 的 稳定 性 分 析 可 以 
大 为 简化 .关联 骨架 由 如 下 构造 的 差分 方程 定义 ， 省 略 定义 TAR 模型 的 方程 中 的 截 距 和 噪声 项 
( 即 零 误 差 及 零 截 距 ) ， 并 令 门 限 等 于 0， 对 模拟 例子 而 言 ， 关 联 肯 架 由 下 述 差分 方程 定义 ; 
DB Yero 
Y, = (15. 4. 4) 
一 1.8Y ,，Y >0 
现在 已 经 得 到 了 上 述 骨 架 的 解 : WEER ys » =(—-18)X05°Xy, HP t>2. 对 负 的 
ys y=0.5 Xy. WERF, WE y0, tooo. 如 果 和 = 二 0， 对 所 有 t, HA y=0, 
则 称 原 点 为 均衡 点 ， 因 为 对 任意 非 零 初 值 ， 上 骨架 以 指数 级 的 速度 趋 于 0， 故 称 原点 为 全 局 指数 
稳定 极限 点 .可 以 证 明 (Chan 和 Tong, 1985) 原点 是 骨架 的 全 局 指数 稳定 极限 点 的 条 件 是 ， 
参数 满足 如 下 约束 : 
$a Zl, a< l, fufa <1 Clos Ta 
在 这 种 情况 下 ， 一 阶 TAR 模型 是 遍历 的 ， 因 此 是 平稳 的 . 图 表 15-10 中 灰色 阴影 表示 出 了 平 
稳 域 .注意 平稳 域 远大 于 由 线性 时 间 序 列 产 生 的 约束 | 办 ,| 二 1，| 加 ,1 | 二 1 所 定义 的 区 域 ， 对 
应 于 图 表 15-10 内 部 正方 形 界 定 的 区 域 ， 当 参数 严格 地 位 于 约束 (方程 15. 4. 5) 定义 的 区 域外 
a, SARE. TAR 模型 是 非 平稳 的 . 例如 ， 如 果 h 二 1， 那 么 对 所 有 充分 大 的 初 值 ， 骨 
架 会 向 正 无 穷 逃 逸 ， 在 由 (15.4.5) 定义 的 参数 区 域 边 界 上 时 ， 在 决定 骨架 的 稳定 性 和 TAR 
模型 的 平稳 性 的 问题 上 ，TAR 模型 的 截 距 项 至 关 重 要 ， 见 Chan 等 (1985)， 实践 中 ， 可 以 者 干 
不 等 的 初 值 用 数值 方法 检验 骨架 是 否 稳定 . 在 假设 模型 平稳 时 ， 骨 架 稳定 能 令 人 信心 倍增 . 
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图 表 15-10 一 阶 TAR 模型 平稳 域 (阴影 部 分 ) 


FT 


15.5 门限 模型 


可 以 容易 地 将 一 阶 〈 自 激励 ) 门限 自 回归 模型 推广 到 高 阶 ， 且 一 般 有 整数 滞后 的 情况 : 

Y= Pio + p11Y i -f oe + $i., Tei aA <2 < į 

a w + $2.1 ¥.1 + + $2,», Yen, Hoze: Ya Sr 

注意 ， 两 个 子 模型 的 自 回归 阶 数 不 必 相 同 ， 延 迟 参 数 d 可 以 大 于 最 大 的 自 何 归 阶 数 . 但 是 ， 如 

果 必 要 的 话 ， 通 过 将 零 系 数 包括 进来 ， 可 以 且 以 后 也 将 一 直 假 设 p=p=p, Kap, Kil 
简化 了 记号 ， 由 方程 (15.5.1) 定义 的 TAR 模型 记 做 TAR(2; pis p2), 3ER d. 

再 次 地 ， 设 门限 等 于 0 并 省 略 噪声 和 截 距 项 ， 得 出 关联 骨架 的 稳定 性 ， 意 味 着 TAR 模型 
是 遍历 的 和 平稳 的 但是， 高 阶 情 况 下 关联 骨架 的 稳定 性 复杂 得 多 ， 以 至 于 目前 仍 对 保证 
TAR 模型 平稳 的 充分 必要 之 参数 条 件 一 无 所 知 ， 尽 管 如 此 ， 保 证 TAR 模型 平稳 的 一 些 简单 的 
充分 条 件 是 存在 的 . 例如， 如 果 | 加 ,| 十 … 十 | 加 ,| 二 1， 并 且 lgi | 十 … 十 | 加 ,| 二 1， 那 
A TAR 模型 是 遍历 的 ， 进 而 亦 是 渐 近 平稳 的 ， 见 Chan Al Tong (1985). 

到 目前 为 止 ， 我 们 考察 了 用 一 cc<<r 一 co 分 割 实 线 所 定义 的 双 区 域 情况 ， 从 而 者 Y,-. 在 第 
一 个 (第 二 个 ) 区 域 ， 则 是 第 一 个 〈 第 二 个 ) 子 模型 在 运行 ， 可 直接 通过 把 实 线 分 割 成 一 = 一 
ni 过 2 二 之 rmi 二 品 ， 将 其 推广 到 m 个 区 域 的 人 情况， 而 究竟 哪个 线性 子 模型 在 运行 由 YY,-。 
相对 于 诸 门 限 的 位 置 决定 ， 下面 不 再 对 此 主题 作 深 人 探讨， 而 将 讨论 局 限 在 双 区 域 的 情况 . 


(15.5.1) 


15.6 门限 非 线 性 的 检验 


虽然 Keenan 和 Tsay 的 非 线性 检验 是 为 检测 二 次 非 线 性 而 设计 的 ， 其 对 于 门限 非 线性 可 能 并 
不 敏感 ， 但 在 此 作为 特定 的 替代 方法 讨论 一 个 门限 模型 的 似 然 比 检验 ， 零 假设 是 AR) 模型 ， 
备 择 假设 是 双 区 域 TAR 模型 ， 阶 数 为 p， 品 声 方差 是 常数 ， 即 a 二 0 二 co， 在 这 些 假设 条 件 下 ， 
一 般 的 模型 可 与 为 
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Y, 一 页, 十 内 YI +: + #1,9¥ yp 加 而 { $2.0 二 加 Yi 十 十 ,spY, p MY, a >r) + oe, 
. (15. 6. 1) 
其 中 符号 I(，) 为 示 性 变量 ， 当 且 仅 当 括号 中 的 表达 为 真 时 取 值 为 1 此外， 在 此 公 却 中 ， 上 
区 域 截 距 相 对 下 区 域 的 改 亚 量 由 系数 P20 表示 9 Po, p... :由 ap 零 假 设 说 明 Pro S fr =" = 
网 ,一 0 虽然 延迟 在 理论 上 可 以 大 于 自 回归 阶 数 ， 但 在 实际 中 很 少见 . 因此， 本 节 假 设 4 三 请 
在 该 假设 下 并 假设 线性 有 效 时 ， 检验 的 大 样本 分 布 不 依赖 于 d. 
实际 中 ， 检 验 是 在 固定 p Md 的 情况 下 进行 的 可 以 证 明 似 然 比 检验 统计 量 等 价 于 


T, = (n— plog{ Seq | (15.6. 2) 


(H) 
其 中 nn 一 p 是 有 效 样本 容量 ，F (Hs) 是 线性 AR) 拟 合 中 噪声 方差 的 极 大 似 然 们 计量 ， 
(Hi) 得 自 拟 合 的 TAR 模型 ， 其 门限 在 某 有 界 区 间 上 搜索 得 到 ， 对 TAR 模型 估计 的 讨论 详 
见 下 节 . ERRE 点 o 一 则 .一 … 一 由 ,一 0 下，( 麻 烦 的 ) 参数 7 缺失， 因此 零 假 设 H PUR 
比 统计 量 的 样本 分 布 不 再 渐 近 地 服从 p 个 自由 度 的 xX 分 布 ， 而 是 服从 某 非 标准 样本 分 布 ， 见 
Chan(1991) 和 Tong(1990). Chan(1991〉 推 导 了 一 种 计算 检验 的 p 值 的 逼近 法 ， 在 p 值 不 大 
时 极其 精确 ， 检 验 依赖 于 搜寻 门限 参数 的 区 间 . 典型 的 区 间 定 义 为 从 第 axX100 百 分 位 数 到 第 OX 
100 百 分 位 数 ， 例 如 从 第 25 百 分 位 数 到 第 75 百 分 位 数 ， 选 择 a 和 45 时， 必须 保 证 落 在 两 个 区 


” 域 里 的 数据 量 足 以 拟 合 线性 子 模 型 . 


为 什么 门限 的 搜索 要 局 限 在 有 界 区 间 内 ? 读者 对 此 也 许 会 有 疑问 ， 直 观 上 看 ， 这 样 的 约束 是 我 
位 所 希望 的 ， 因 为 在 不 同 假设 下 的 双 区 域 上 ， 需 要 有 充足 的 数据 来 估计 和 参数， 本质 上 更 深层 的 原因 
在 于 数学 ， 该 限制 的 必要 性 在 于 ， 如 果真 实 模型 是 线性 的 ， 那 么 无 法 定义 门限 参数 ， 此 时 无 约束 的 
搜索 可 能 导致 门限 估计 量 非常 接近 最 小 或 最 大 的 数据 值 ， 从 而 使 得 大 样本 逼近 失效 . 

这 里 用 〈 经 开 方 变换 的 ) 相对 太阳 黑子 和 经 对 数 变 换 的 ) 捕食 者 数据 来 说 明 门限 非 线性 
的 似 然 比 检验 ， 如 前 所 述 ，Keenan 检验 和 Tsay 检验 都 指出 这 些 数据 是 非 线性 的 ， 对 太阳 怖 于 
数据 ， 令 p=5, a=0. 25，0 一 0.75， 我 们 用 从 1 到 5 的 不 同 延 迟 进行 门限 非 线性 似 然 比 检验 ， 
检验 统计 值 分 别 等 于 46.9，111.3，99.1，85.0 和 45.18. Sa=-0.1, b=0.9 重复 检验 ， 所 
得 结果 相同 ， 所 有 上 述 检验 的 p 值 都 小 于 0.000， 说 明 数 据 生成 机 制 高 度 非 线 性 ， 注 意 在 d 一 2 
时 ， 检 验 统 计量 达到 最 大 值 ， 因 此 可 以 有 意识 地 估计 延迟 等 于 2， 但 是 延迟 等 于 3 也 是 极 具 竞 
争 力 的 选择 . 

下 面 使 用 捕食 者 序列 ， 令 p=4, a=0.25, 6 二 0.75，1 信 4d<4。， 我 们 发 现 括号 内 的 检验 统计 全 
及 其 p 值 分 别 等 于 19. 3(0.026)，28. 0(0. 001), 32. 0(0. 000) 和 16. 2(0.073)， 因 此 有 迹象 表明 捕食 
者 序列 是 非 线性 的 ， 其 延迟 可 能 是 2 或 者 3， 注 意 d=4 时 ， 在 5%% 显 著 水 平 上 检验 并 不 显著 ” . 


O ”进行 这 些 计 算 的 R 程序 代码 如 下 ; 

Evaluem= NULL 

forid inl: 5) { res= tlrt (sqrt (spots); p= 5,d= d,a= 0.25,b= 0.75) 
pvaluem= cbind( pvaluem, c(d,res$ test.statistic,resS p.value)) } 
rownames (pvaluem)= c('d','test statistic','p- value’) 


V sY¥ 


Vv 


round (pvaluem, 3) 


© ”该 计算 的 RR 程序 代码 与 上 面 的 类 似 。 详 见 本 书 网 站 第 15 章 的 R 代码 脚本 ， 
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15.7 TAR 模型 的 估计 


因为 TAR 模型 的 平稳 分 布 没 有 闭 式 解 ， 所 以 通常 以 max(p，d) 个 初始 值 为 条 件 展开 佑 
计 ， 其 中 p 是 过 程 的 阶 数 ，d 是 延迟 参数 . 另外， 通常 假设 噪声 序列 服从 正 态 分 布 ， 本 节 都 采 
用 这 一 假设 . 正 态 误 差 假 设 意味 着 啊 应 服从 条 件 正 态 分 布 ， 而 近期 针对 非 正 态 情 况 的 研究 进展 
见于 Samia, Chan 和 Stenseth(2007)， 如 果 已 知 门 限 参 数 r 和 延迟 参数 d， 则 可 根据 Y,， Sr 
成 立 与 否 将 数据 分 为 两 个 部 分 ， 设 下 区 域 中 有 m 个 数据 ， 当 数据 在 下 区 域 时 ,可 将 Y, 对 其 1 
到 尹 阶 滞后 进行 回归 ， 得 到 估计 ioith 以 及 噪声 方差 的 极 大 似 然 估计 笃 ; 即 残 差 平方 
和 除 以 六 :一般 地 ， 下 区 域 里 mm 的 数值 与 参数 的 估计 都 依赖 于 ”> 和 ad; 为 清楚 起 见 ， 下 面 有 
时 会 采用 显 式 的 记号 ， 如 m(r，d)， 类 似 地 ， 使 用 落 在 上 区 域 的 数据 ， 比 如 ns 个 ， 可 得 到 参 
数 估计 多, 高，…, 训 .及 党， 显然 ，nn 十 ns 二 n 一 p， 其 中 是 样本 容量 ， 把 这 些 估计 量 带 人 对 
数 似 然 函 数 ， 得 到 所 谓 的 (rr，d) We Aste WR BH. 


lr,d) =— BB (1 + log(2n) )— ARO log Câi Crd)? — PP loge Crd)? 


(15. 7.1) 

最 大 化 上 面 的 轮廓 似 然 函数 可 得 到 ~ 和 的 佑 计 ， 对 -的 优化 搜索 仅 需 局 限于 观测 Y 中 ， 对 整 
数 了 仅 在 1 到 户 中 即 可 . 这 是 因为 ， 对 固定 的 &， 在 两 个 相 邻 观测 间 上 述 函 数 取 值 为 常数 . 

但 是 ， 若 不 对 门限 参数 有 所 限制 ， 上 面 讨 论 的 《条 件 ) 极 大 似 然 估计 法 是 无 法 应 用 的 ， 例 
如 ， 对 于 下 区 域 仅 含 一 个 数据 的 情况 ， 噪 声 方 差 站 王 0， 因此 条 件 对 数 似 然 函 数 等 于 cc ， 这 时 
条 件 极 大 似 然 估 计量 显然 不 满足 一 致 性 ， 把 门限 搜索 局 限 在 两 个 事先 确定 的 了 的 百 分 位 数 之 
闻 ， 例 如 站 的 第 10 百 分 位 数 和 第 90 百 分 位 数 之 间 ， 可 规避 此 问题 . 

针对 前 述 困难 还 有 一 个 解决 的 方法 ， 即 用 条 件 最 小 二 乘法 (CLS) 来 估计 参数 .CLS 参数 
估计 是 通过 最 小 化 预测 误差 平方 和 得 到 的 ， 或 者 在 同方 差 (常数 方差 ) 噩 斯 误差 情 交 下 ，o = 
oz 二 ao， 等 价 于 条 件 极 大 似 然 估计 ， 因 此 极 大 化 对 数 似 然 肾 数 等 价 于 最 小 化 条 件 残 差 平 方 和 : 


Ltrsd) = a (CY, — $4, E 1 Y T 一 四,。Y， Pela ICY, al = r) 
I 


+ CY, — $2.0 — $21 Yeu — oe OY) ICY > rr) (15.7.2) 
HPSYu<r, KY- Srn 等 于 1， 否 则 等 于 0 MY.) 定义 类 似 ， 骨 一 次 地 ， 对 7 的 
优化 搜索 仅 需 限于 观测 Y 中 ， 对 整数 d 的 搜索 限于 1 到 p 之 间 . 条 件 最 小 二 乘法 的 优势 在 于 
门限 参数 搜索 无 约束 ， 在 较 宽 的 条 件 下 ， 包 括 平 稳 条 件 及 真实 条 件 均值 函数 不 连续 等 情况 下 ， 
Chan(1993) 证 明了 CLS 法 满足 一 致 性 ， 即 随 样本 容量 的 增长 ， 估 计量 萤 近 真实 值 ， 因 为 延迟 
是 整数 ， 一 致 性 意味 着 在 大 样本 容量 情况 下 ， 延 迟 居 计量 终 将 等 于 真实 值 ， 进 一 步 ， 门 限 估 计 
量 样本 误差 的 阶 是 1/n， 而 其 他 参数 样本 误差 的 阶 是 1n. 门限 参数 与 延迟 参数 快速 收敛 到 真 
实 值 ， 意 味 着 在 评价 自 回 归 参 数 估 计 的 非 确 定 程度 时 ， 可 视 门 限 和 延迟 为 已 知 量 ， 因 此 ， 双 区 
域 自 回 归 参 数 估 计量 渐 近 相互 独立 ， 其 样本 分 布 与 应 用 普通 最 小 二 乘法 于 来 自 相 应 真实 区 域 数 
据 所 得 估计 的 分 布 渐 近 相同 ， 如 果真 实 参 数 满足 前 面 提 到 的 正则 条 件 ， 则 上 述 大 样本 分 布 的 结 
论 可 提升 至 条 件 极 大 似 然 估计 的 情况 ， 最 后 注意 ， 如 果真 实 条 件 均 值 函 数 连 续 ， 前 述 佑 计量 的 
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大 样本 性 质 将 有 根本 性 的 变化 ， 见 Chan 和 Tsay(1998). 

实际 中 ， 在 双 区 域 上 AR 的 阶 数 不 必 相等 或 已 知 ， 因 此 能 同时 对 阶 数 做 出 佑 计 的 有 效 估 计 
过 程 就 变 得 至 关 重 要 了 . 忆 及 前 面 提 出 的 ， 对 于 线性 ARMA 模型 ，AR 的 阶 数 可 以 通过 最 小 
化 AIC 来 估计 ， 对 于 固定 的 r+ 和 4，TAR 模型 本 质 上 分 别 拟 合 阶 数 为 p, Mp. 的 两 个 AR 模 
型 ， 因 此 AIC 成 为 

AIC(p; bsryad) =— 2l(r.d) + 2(p, + p: +2) (15. 7. 3) 
Ethier. d, oo. a 之 外 ， 参 数 的 个 数 等 于 pı tp: +2. ME, MMe AICCMAIC) 估计 法 
估计 参数 时 所 最 小 化 的 AIC WER PARA: 在 某 些 可 保证 任何 区 域 者 有 足够 数据 用 于 个 
计 的 区 间 内 搜索 门限 参数 ， 基 于 把 门限 参数 作为 额外 参数 这 一 直观 的 想法 ， 如 上 所 得 最 小 的 
AIC 加 2 后 的 结果 称 为 估计 门限 模型 的 和 名义 AIC， 因 为 门限 参数 一 般 会 给 模型 增加 很 多 的 灵活 
性 ， 所 以 也 可 能 给 模型 增加 不 止 一 个 自由 度 .从 渐 近 角度 看 ， 这 可 能 等 价 于 给 模型 增加 了 三 个 
自由 度 ， 见 Tong(1990，248 页 ). 

下 面 用 捕食 者 序列 来 说 明和 估计 方法 ， 在 估计 中 ， 固 定 最 大 阶 数 p54, l<d<4. BRAK 
数 是 由 AIC 确定 的 AR 模型 的 阶 数 ， 可 能 不 小 于 真实 TAR 模型 的 阶 数 . 另外， 阶 数 亦 可 用 依 
靠 强大 计算 能 力 的 交叉 验证 方法 来 确定 ， 见 Cheng 和 Tong(1992). 使 用 MAIC 方法 ， 大 致 在 
第 10 百 分 位 数 和 第 90 百 分 位 数 之 间 搜 索 门限 ， 图 表 15-11 给 出 了 lxd<4 时 估计 TAR 模型 
的 和 名义 AIC 值 ， 当 d= 二 3 时， 名 义 AIC 值 最 小 ， 所 以 对 延迟 的 估计 为 3， 图 表 15-12 对 相关 模 
型 的 拟 合 进 行 了 总 结 . 

” 图表 15-11 <da 时 ， 取 对 数 后 (捕食 者 】 的 序列 之 拟 合 TAR 模型 的 名 义 AC 


d AIC F By Be 

1 19. 04 4, 15 2 ] 

2 12. 15 4,048 1 4 

3 10. 92 4.661 1 4 

4 18. 42 5, 096 3 4 
> AICM-NULL 


for(d in 1:4) 
{predator.tarstar (y=log (predator .eq) ,p1=4,p2=4,d=d,a=.1,b=.9) 
AICM=rbind(AICmM, 
c(d, predator.tarSAIC, signif (predator.tar$thd,4), 
predator.tar$pl1,predator.tar$p2) ) } 
colnames (AICM}=c('d','nominal AIC','r','pl','p2') 
rownames {AICM} =NULL 
> AICM 


W 


W 


YVO W 


虽然 最 大 的 自 回 归 阶 数 是 4，MAIC 法 在 下 区 域 所 选择 的 阶 数 是 1， 在 上 区 域 所 选 阶 数 是 
4， 使 用 落 在 每 个 区 域 中 的 数据 ， 应 用 普通 最 小 二 乘法 〈OLS) 售 计 各 区 域 的 子 模 型 ， 因 此 ， 
对 于 噪声 方差 更 为 无 偏 的 估计 可 由 有 效 样本 容量 归 一 化 的 区 域内 误差 平方 的 残 差 和 伯 计 . 这 里 
的 有 效 样 本 容量 等 于 对 应 区 域 中 的 数据 数量 减 去 相关 子 模型 的 自 回 归 参 数 的 个 数 《包括 截 距 
项 )， 第 i 个 区 域 中 的 “无 偏 ” 品 声 方差 名 及 其 相应 的 极 大 似 然 估计 量 间 的 关系 ， 用 下 式 表示 : 
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a 


nj 
eT; = 一 
ni— p;— 1 


其 中 p 是 第 i 个 子 模型 的 自 回 归 阶 数 . 另 外，(n 一 pp 一 1)32/3? 近似 服从 nn; 一 pp 一 1 个 自由 度 
的 Xx 分 布 ， 在 每 个 区 域 上 ， 图 表 15-12 中 所 列 的 + 统计 量 和 相应 的 p 值 都 与 用 落 在 该 区 域 中 
的 数据 拟 合 自 回归 模型 的 计算 机 输出 相等 ， 注 意 在 上 区 域 中 ， 汪 后 2 和 3 的 系数 均 不 显著 ， 而 
滞后 4 在 5%% 显 著 水 平 上 略为 显著 ， 因 此 上 区 域 的 模型 抑或 可 用 一 阶 自 回归 模型 逼近 ， 稍 后 将 
论 及 此 点 . 


d: (15.7.4) 


图 表 15-12 ”对 捕食 者 数据 氢 合 的 TAR (2; 1, 4) MB: MAIC 法 


估计 值 标准 误差 t eit 户 值 
d 3 
f 4. 661 
PR (n = 30) 
$0 0. 262 0. 316 0. 831 0. 41 
$i, 1, 02 0. 0704 14.4 0. 00 
of 0. 0548 
上 区 域 (mz 一 23) 
ben 4. 20 1. 28 3.27 o. 00 
2,1 0. 708 0. 202 3. 50 0. 00 
$e, —0. 301 0. 312 —0. 965 0. 35 
$3 0. 279 0. 406 0. 686 0. 50 
Baa —0. 611 0. 273 一 2, 24 0. 04 
oe 0. 0560 


> predator.tar.l=tar (y=log(predator.eq) ,pl=4,p2=4,d=3,a=.1,b=.9, 
print=T} 

> tar (y=log(predator.eq) ,pl=1,p2=4,d=3,a=.1,b=.9,print=T, 
method='CLS') # re-do the estimation using the CLS method 

> tar (y=log (predator .eq) ,pl=4,p2=4,d=3,a=.1,b=.9,prints=T, 
method='CLS') # the CLS method does not estimate the AR orders 


门限 估计 值 是 4 661， 大 致 是 第 57 百 分 位 数 . 一 般 地 ， 太 靠近 观测 数据 最 小 值 或 最 大 值 的 门限 
估计 也 许 不 可 靠 ， 原 因 是 在 一 个 区 域 中 的 样本 容量 太 小 ， 所 幸 该 例 不 是 这 种 情况 .图表 15-12 并 未 
列 出 门限 估计 量 的 标准 误差 ， 因 其 样本 分 布 非 标 准 并 且 相 当 复 杂 ， 类似 地 ， 延 迟 估 计量 的 离散 性 使 
其 标准 误差 一 无 所 用 ， 但 是 ， 也 许可 用 一 种 参数 化 的 自助 法 来 推断 门限 和 延迟 参数 ， 另 一 种 方法 是 
采用 Geweke 和 Terui (1993) 的 贝 叶 斯 (Bayesian) 法 . HE., WA ARCA) 模型 有 分 别 等 于 0. 943 
(0. 136), —0.171(0. 188) ， 一 0. 1621(0. 186) 和 一 0. 238(0. 136) 的 滞后 1 到 4 的 系数 估计 ， 括 号 内 
为 标准 误差 ; 虽 声 方差 估计 值 是 0.0852， 远 大 于 TAR (2; 1, 4) 模型 的 噪声 方差 ， 注意 ARG) 的 
系数 估计 接近 于 不 显著 ，AR(2) 和 ARG) 系数 估计 都 不 显著 . 

在 对 两 个 区 域 的 解释 上 有 个 非常 有 趣 的 问题 . 一 种 探求 区 域 实质 的 方式 是 ， 对 观测 过 程 的 
时 间 序 列 图 中 究竟 有 哪些 数据 落 于 哪个 区 域 中 进行 识别 ， 在 图 表 15-2 的 时 间 序 列 中 ， 落 在 下 
区 域 的 数据 CBD 3 阶 滞后 小 于 4. 661 的 数据 ) 用 实心 点 表示 ， 而 在 上 区 域 的 数据 用 空心 点 表 
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a. 图 形 揭示 出 所 估计 出 的 下 区 域 对 应 于 捕食 者 循环 的 上 升 阶 段 ， 上 区 域 对 应 于 捕食 者 循环 的 
下 降 阶 段 ， 下 面 是 一 种 生物 学 角度 的 解释 ， 当 一 天 半 之 前 捕食 者 数量 水 平 较 低 时 ， 食 饵 种 群 数 
量 得 以 在 此 期 间 增 加 ， 困 此 捕食 者 种 群 量 也 将 开始 增长 . 另 一 方面 ， 当 一 天 半 前 捕食 者 数量 大 
于 106~exp(4.661) 时 ， 食 饵 种 群 数 量 将 在 间隔 期 内 急剧 减少 ， 造 成 捕食 者 数量 开始 剧 减 ， 
在 上 升 阶 段 (下 区 域 ) ， 捕 食 者 种 群 数量 从 趋势 上 看 ， 是 伴随 着 也 许 受 其 他 环境 条 件 影响 较 小 
的 食 饵 种 群 的 稳健 增长 而 增长 的 . 另 一 方面 ， 在 下 降 阶 段 (上 区 域 )， 捕 食 者 种 群 已 因 周 围 食 
物 的 匮乏 而 有 所 削弱 ， 所 以 疑似 受 环境 条 件 的 影响 更 大 .这 也 许 解 释 了 为 什么 下 区 域 噪 声 方差 
会 略 小 于 上 区 域 ， 也 即 存在 微小 的 条 件 异 方差 . 虽然 即将 议 及 的 TAR(2; 1, 1) 模型 中 条 件 
异 方差 更 明显 ， 但 是 双 区 域 里 噪声 方差 间 的 差别 不 可 能 是 显著 的 ， 一 般 地 ， 由 啊 应 的 d 阶 河 后 
值 的 相对 位 置 所 定义 的 区 域 恰 是 能 影响 线性 子 模型 间 跳 变 的 潜藏 过 程 的 代理 . 一旦 深信 了 解 了 
跳 变 的 机 制 ， 则 有 可 能 建立 门限 机 制 的 显 式 异型 ， 

虽然 上 面 基于 时 间 序 列 图 给 出 了 区 域 的 解释 ， 但 考察 拟 合 的 子 模型 抑或 可 予以 证 实 . 下 区 
域 的 拟 合 模型 意味 着 在 对 数 的 标 度 上 有 

Y, 一 0.262 十 1.02Y ,十 0.234e， (15.7.5) 

1 阶 滞后 系数 基本 上 等 于 1， 说 明了 捕食 者 种 群 的 (中 位 数 ) 增长 率 为 每 半天 (exp 
(0. 262) 一 1}100%=*30%， 尽 管 截 距 项 在 5 最 水 平 上 不 显著 ， 子 模型 是 爆炸 性 的 ， 因 为 假如 不 
予以 检验 ， 则 当 tool}, A Y,-oe, 

因 其 阶 数 为 4， 所 以 有 关上 区 域 拟 合 模型 的 解释 就 不 那么 直观 了 . 但 是 ， 前 已 说 明 可 以 用 
AR(1) 模 型 逼近 它 .， 据 些 ， 在 两 个 区 域 上 令 最 大 阶 数 为 1 重 估 TAR BRS. 门限 估计 不 变 。 下 区 
域 增加 了 1 个 数据 ， 并 要 求 更 少 的 初始 数据 ,但 是 自 回 归 系 数 基本 不 变 。 上 区 域 拟 合 模型 变 为 


Y, 一 0.517 十 0.807Y + 0. 989e, (15.7.6) 
是 一 个 平稳 子 模型 .对 数 标 度 上 的 增长 率 等 于 
Y,—Y,, = 0.517 — 0. 193Y,ı + 0. 989e, (15.7.7) 


中 位 数 为 负 ， 这 是 因为 上 区 域 中 六 ,>4.661. 注意 ， 现 在 条 件 异 方差 性 比拟 合 TAR (2; 1, 4) 
模型 更 加 明显 了 .延迟 d=3 的 TAR (2; 1, 1) MAM (4M) AIC 等 于 14. 78， 但 因为 样本 容 
量 不 同 ， 所 以 与 TAR (2; 1，4) 模型 的 10. 92 并 不 直接 可 比 . 具有 不 同样 本 容量 的 模型 可 以 用 每 
次 观测 的 名 义 AIC 来 进行 比较 ， 本 例 中 ， 当 阶 数 从 4 降 至 1 时 ， 归 一 化 的 AIC 从 0. 206= 10. 92/ 
53 增加 到 0. 274=14. 78/54， 说 明 TAR(2; 1, 4) 模型 优 于 TAR (2; 1, D 模型 . 

研究 骨架 的 长 期 ( 渐 近 ) 行为 是 评价 非 线性 模型 的 另 一 种 方法 .回想 一 下 ， 省 略 模型 的 噪 
声 项 得 到 其 骨架 ， 即 用 0 代 蔡 噪声 项 ， 骨 架 可 能 发 散 到 无 穷 ， 也 可 能 收敛 到 极限 点 、 极 限 循环 
或 者 奇异 吸引 子 ， 相 关 定 义 及 深入 探讨 见 Chan 和 Tong(2001). 平稳 ARMA 模型 的 骨 染 总 是 
收 合 到 某 个 极限 点 ， 另 一 方面 ,平稳 非 线 性 模型 的 骨架 有 可 能 展示 出 前 述 所 有 复杂 的 动态 . 拟 
合 TAR(2; 1，4) 模型 的 骨架 看 起 来 会 收敛 到 周期 为 10 的 极限 循环 ， 见 图 表 15-13. 在 以 下 
音义 上 极限 循环 是 对 称 的 ， 其 上 升 阶段 与 下 降 阶段 长 度 相同 ， 骨 架 明 显 的 长 期 稳定 性 意味 者 
d= 二 3 的 拟 合 TAR(2; 1，4) 模型 平稳 ， 一 般 地 ， 模 型 中 包含 噪声 项 时 ， 可 以 通过 从 随机 模型 


© predator.tar.2=tar(log(predator.eq) ,pl=1,p2=1,d=3,a=.1,b=.9, print=T) 
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中 模拟 某 些 序列 的 方法 研究 模型 的 动态 ， 图 表 15-14 示 出 了 拟 合 TAR(2; 1, 4) 模型 的 一 个 
典型 实现 . 


图 表 15-13 捕食 者 序列 TAR (2; 1, 4) 模型 的 骨架 


> tar.skeleton(predator.tar.1) 


图 表 15-14 ”模拟 的 TAR (2; 1, 4) 序列 


> set.seed (356813) 
> plot (y=tar.sim(n=57,object=predator.tar.1)$y,x=1:57, 
ylab=expression(Y[{t]),xlab=expression(t) ,type='o') 


d=3 的 拟 合 TAR(2; 1, 1) 模型 骨架 的 极限 循环 是 对 称 的 ， 上 升 阶段 长 度 是 5， 下 降 阶 
段 长 度 是 4， 见 图 表 15-15， 拟 合 TAR(2; 1, 1) 模型 的 实现 见 图 表 15-16. 


图 表 15-15 ”捕食 者 序列 一 阶 TAR 模型 的 骨架 


> predator .tar.2=tar (log (predator .eq) ,pl=1,p2=1,d=3,a=.1,b=.9, 
print=T) 


> tar.skeleton(predator.tar.2) 
一 


FAR 15-16 WE TAR (2; 1, 1) 模型 的 模拟 


6.0777 


so] A / 
< "i 


> set.seed (356813) 
> plot (y=tar.sim(n=57,object=predator.tar.2)$y,x=1:57, 
ylab=expression(Y¥[t]),xlab=expression(t) ,type='o') 


去 掉 捕 食 者 数据 里 两 个 初始 瞬 态 循环 以 及 最 后 不 完整 的 循环 ， 图 表 15-17 中 列 出 了 余下 所 
有 连续 的 增长 和 和 下降 阶段 的 长 度 值 . 通过 观 图 表 15-17 ”捕食 者 序列 增长 与 下 降 阶 段 的 长 度 
察 ， 增 长 阶段 的 平均 长 度 是 5.4， FRR RM ~— °° °° °° &«O-PB © 
平均 长 度 是 4. 6. 

当 增 长 阶段 长 于 下 降 阶 段 时 ， 就 会 出 现 不 
对 称 的 迹象 . 基于 对 循环 长 度 的 分 析 ， 相 比 
TAR(2; 1, 4) 模型 ，TAR(2; 1，1) 模型 
显得 更 具 非 对 称 循 环 性 质 ， 而 就 循环 长 度 与 观 
测 到 的 平均 循环 长 度 匹 配 度 而 言 ， 后 者 更 高 . 
在 循环 行为 上 对 于 拟 合 模 型 与 真实 数据 之 间 更 严谨 的 比较 ， 可 以 通过 比较 真实 数据 和 拟 合 模 型 
某 个 长 实现 的 谱 密 度 得 到 ， 图 表 15-18 用 一 个 G3, 3) 跨度 的 修正 Daniell 窗 绘 出 了 数据 的 谱 . 
图 中 还 同时 绘 出 了 拟 合 TAR(2; 1, 4) MR CHER) 和 拟 合 TAR(2; 1, 1) 模型 (点 线 ) 的 
谱 ， 二 者 所 用 模拟 实现 的 长 度 均 为 10 000， 都 用 了 (200, 200) 跨度 的 修正 Daniell 窗 以 及 
10% 的 锥 前 .可 以 看 出 ，TAR(2; 1，4) 模型 的 谱 的 走势 与 捕食 者 序列 的 非常 接近 ， 略 优 于 
简化 的 TAR(2; 1，1) 模型 . 

注意 对 捕食 者 数据 应 用 条 件 最 小 二 乘法 ， 所 得 估计 与 4 二 3 时 的 门限 估计 相同 ， 从 而 其 他 参 
数 的 估计 亦 然 ， 虽 非 总 有 此 类 结论 ， 最 后 ， 对 捕食 者 序列 分 析 做 些 澄清 说 明 . 鉴于 实验 的 诱饵 序 
列 亦 可 得 到 ， 故 也 可 就 二 元 时 间 序 列 分 析 进 行 研究 .但 由 于 多 时 间 序 列 的 非 线性 时 间 序 列 分 析 领 
域 并 不 成 熟 ， 这 里 就 不 讨论 了 另外， 真实 的 生物 数据 通常 是 可 观测 的 ， 丰 富 的 食 饵 种 群 数量 通 
常 要 比 捕食 者 数量 种 群 噪声 更 大 ， 原 因 是 趋势 上 捕食 者 种 群 数量 比 食 饵 种 群 少 ， 而 且 ， 当 捕食 者 
对 象 减少 时 ， 捕 食 者 可 能 转 食 其 他 可 捕 到 的 种 群 ， 导 致 食 饵 一 捕食 系统 更 为 复杂 . 例如 ， 在 好 的 
年 份 ， 墅 免 随 处 可 见 ， 而 其 猎 食 者 猫 独 却 难 更 影 踪 ! 因此 ， 生 物 学 分 析 通 常 聚焦 于 捕食 者 种 群 的 
丰 度 上， 尽管 如 此 ， 针 对 捕食 者 种 群 丰 度 的 单 变量 时 间 序列 分 析 ， 有 可 能 对 食 饵 一 捕食 者 交互 作 
用 的 研究 提供 极 具 价值 的 生物 学 洞 见 ， 见 Stenseth 等 (1998，1999) 对 加 拿 大 猫 独 序 列 专栏 中 的 
相关 论述 ， 延 迟 等 于 2 的 TAR (2; 2, 2) MMA ARM RRM, RR 2 提供 了 完美 的 生物 
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学 解释 ， 注 意 ， 对 于 捕食 者 序列 而 言 ， 延 迟 2 极 具 竞争 力 ， 见 图 表 15-11， 因 而 就 生物 学 基础 而 
言 也 可 能 会 更 受 青 睐 ， 在 一 道 习 题 中 ， 会 要 求 读者 用 延迟 固定 为 2 的 捕食 者 序列 拟 合 TAR 模型 ， 
并 根据 Stenseth 等 (1998，1999) 的 研究 框架 解读 得 到 的 结果 . 


图 表 15-18 对 数 【捕食 者 } 序列 的 谱 ， 虚 线 是 TAR (2; 1, 1), ARÆ TAR (2; 1, 4) 


set .seed (2357125) 
yy.1.4=tar.sim(predator.tar.1,n=10000) Sy 
yy .l=tar.sim(predator.tar.2,n=10000) Sy 
spec.1.4=spec(yy.1.4,taper=.1, span=c(200,200),plot=F) 
spec.l=spec(yy.1,taper=.1, span=c(200,200),plot=F) 
spec.predator=spec (log(predator.eq),taper=.1, 

span=c (3,3),plot=F) 
> spec. predator=spec (log (predator .eq) ,taper=.1,span=c(3,3), 

ylim=range (c(spec.1.4$spec,spec.1$spec, spec.predator$spec) ) ) 

> lines (y=spec.1.4$spec,x=spec.1.4$freq, lty=2) 
lines (y=spec.1$spec,x=spec.1$freq, 1lty=3) 


VY VY wv V V 


W 


15.8 模型 诊断 


在 15.7 节 已 介绍 过 几 种 模型 诊断 技术 ;例如 ， 上 骨架 分 析 和 模拟 .在 此 ， 将 讨论 一 些 用 残 
差分 析 进 行 模型 诊断 的 正式 的 统计 方法 .原始 的 残 差 定义 为 自 真实 数据 减 去 拟 合 值 ， 其 中 第 r 
个 拟 合 值 是 利用 给 定 的 过 去 的 Y 值 对 Y, 条 件 均值 所 作 的 估计 ， 即 残 差 & 由 下 式 给 出 : 
a =Y, — ($o + Ria Ym H+ rY Ea KP {Rro H aY HeH SaYo OaD 
(15. 8. 1) 
这 些 残 差 与 得 自 拟 合 子 模型 的 原始 残 差 相 同 . 用 适当 的 标准 差 来 规范 化 原始 残 差 ， 即 得 到 标准 
化 的 残 差 : 
即 用 下 CE) 区 域 的 噪声 标准 差 估计 规范 下 CL) 区 域 的 原始 残 差 ， 正如 线性 情况 里 一 样 ， 标 
准 残 差 的 时 间 序 列 图 看 上 去 应 为 随机 的 ， 原 因 在 于 如 果 TAR 模型 是 真实 的 数据 机 制 ， 即 若 
TAR 模型 被 正确 地 识别 ， 那 么 标准 残 差 应 该 是 渐 近 独立 同 分 布 的 ， 如 前 ， 在 该 图 中 寻找 异常 
值 和 任意 的 系统 模式 ， 从 中 可 能 找到 确定 更 恰当 模型 的 线索 . 通过 检查 标准 残 差 的 样本 ACF, 
可 以 检验 标准 化 误差 的 独立 性 假设 ， 通 过 检查 标准 残 差 平方 或 者 标准 残 差 绝对 值 的 样本 ACF, 
也 可 检验 非常 数 的 方差 . 


(15. 8. 2) 
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此 处 ， 基 于 残 差 自 相 关 郴 数 幅 值 的 某 总 体 度量 来 考虑 混合 检验 的 推广 ， 读 者 可 能 需 复习 
12.5 节 的 内 容 ， 在 那里 曾 解 释 过 ， 即 便 已 经 正确 设 定 模型 ， 残 差 及 样本 自 相 关系 数 通常 都 是 
相关 的 .不同 于 线性 ARIMA 模型 之 情形 ， 残 差 的 相关 性 必然 要 求 使 用 残 差 自 相关 系数 的 ( 复 
Ju by) 二 次 型 


Bn 一 neg 2, 21%: D: D; (15. 8.3) 
其 中 nen 二 n 一 max(pP1，p:，d) 是 有 效 样本 容量 ，A 是 标准 残 差 的 第 i THA 自 相 关系 数 ，g,; 
是 附录 L 给 出 的 模型 相依 的 若干 常数 ， 如 果真 实 模 型 是 TAR 模型 ，P: 很 可 能 接近 于 0, Bu 亦 
然 ， 但 若 模 型 设 定 错误 ， 则 B., 倾向 于 取 大 值 . 二 次 型 的 设计 目的 是 使 B, ARMA m TAH 
度 的 Xx 分 布 ， 数 学 理论 预计 了 当 样 本 容量 取 较 大 的 值 ， 且 m 相对 于 样本 容量 取 较 小 的 数值 时 ， 
一 般 来 说 X 分 布 通 近 会 更 精确 . 
实践 中 ， 在 m 一 定 的 取 值 范围 内 ， 绘 出 Ba H p 值 对 于 mm HRB AS eS m e FE 
价 标准 误差 的 独立 性 假设 .图表 15-19 最 下 面 的 图 示 出 了 前 述 捕食 序列 拟 合 TAR (2; 1，1) 模 
型 的 混合 检验 ， 其 中 1 过 mm 过 12， 最 上 面 的 图 是 标准 残 差 的 时 间 序 列 图 . 除 一 个 可 能 的 异常 什 
外 ， 图 形 未 表明 特别 的 模式 ， 中 间 的 图 是 标准 残 差 的 ACF 图 ， 基 于 简单 的 1. 96/Vn 规 则 得 到 
置信 区 间 带 ， 应 视 为 判断 残 差 ACF 显著 性 的 简单 引导 图形 表明 了 1 阶 滞后 残 差 自 相 关系 数 
是 显著 的 ， 当 mm 过 6 时 ， 更 严格 的 混合 检验 都 是 显著 的 ， 说 明 TAR(2; 1，1) 模型 拟 合 有 所 欠 
缺 ， 对 TAR(2; 1, 4) 模型 的 类 似 诊断 见 图 表 15-20. 现在 唯一 潜在 的 问题 即 在 于 那个 可 能 的 
异常 值 ， 但 是 删 掉 包括 潜在 异常 值 在 内 的 最 后 四 个 数据 所 引致 的 拟 合 模型 变化 很 小 ， 因 些 ， 结 
论 是 拟 合 TAR(2; 1，4) 模型 相当 地 稳健 ， 图 表 15-21 给 出 了 标准 残 差 的 正 态 得 分 QQ 图 ， 
该 图 中 显示 为 直线 ， 故 误差 服从 正 态 分 布 。 总 之 ， 拟 合 TAR(2; 1, 4) 模型 很 好 地 拟 合 了 捕 
食 者 序列 ， 


图 表 15-19 ”对 一 阶 TAR 模型 的 诊断 检验 ， 捕食 者 序列 


标准 残 差 


we eit) ACF 


> win.graph (width=4.875,height=4.5) 
> tsdiag(predator.tar.2,gof.lag=20) 
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图 表 15-20 对 TAR (2; 1, 4) 模型 的 诊断 检验 : 捕食 者 序列 


> tsdiag(predator.tar.1,gof.1lag=20) 


= 


图 表 15-21 ”标准 残 差 的 正 态 QQ 图 


攻 ae ee 
理论 分 位 数 


> win.graph(width=2.5,height=2.5,pointsize=8) 
> qgnorm(predator.tar.1$std.res) ; qqline(predator.tar.1$std.res) 


15.9 预测 


本 节 考 虑 用 TAR 过 程 预测 未 来 取 值 的 问题 ， 实 践 中 是 基于 估计 的 TAR 模型 作 预 测 . 但 与 
ARIMA 模型 的 情况 一 样 ， 相 对 于 过 程 的 自然 波动 来 说 ， 通 常 参数 估计 所 带 来 的 不 确定 性 很 小 ， 改 
下 面 将 把 拟 合 模型 视 为 真实 的 模型 。 未 来 取 值 的 不 确定 性 (比如 Yi: 完全 取决 于 给 定 当 前 和 过 去 
数据 Y,，Y, , ，… 的 条 件 概率 分 布 ， 称 为 《 步 向 前 预测 分 布 ， 对 于 具有 正 态 误差 的 ARIMA 模 型 ， 其 
所 有 预测 分 布 都 是 正 态 的 ， 这 就 大 大 简化 了 对 预测 置信 区 间 的 计算 ， 因 为 只 要 找到 预测 分 布 的 均值 
和 方差 即 可 ， 但 通常 非 线性 模型 的 预测 分 布 不 是 正 态 的 ， 也 不 可 解 。 因 而 预测 区 间 可 能 要 费劲 地 通 
过 模拟 来 计算 ， 这 一 模拟 方法 可 以 通过 一 阶 非 线性 自 回归 模型 来 很 好 地 子 以 证 明 : 

Vig = ACY sem) Ciba 9.1) 
BEY Syo Yr yes “ts A Yai SAY, e+1)， 因 此 ， 可 从 误差 分 布 抽 样 得 到 e,+1， 并 
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计算 AC Yis @41)5 从 而 由 所 得 一 步 向 前 预测 分 布 可 以 获取 Yiri 的 一 个 实现 . 独立 地 重复 B 次 
该 过 程 ， 比 如 1000 次 ， 可 自 一 步 向 前 预测 分 布 得 到 B 个 随机 样本 ， 可 以 用 这 B 个 样本 的 均值 
作为 一 步 向 前 预测 均值 的 估计 ， 但 为 确定 预测 信息 概括 的 优 劣 ， 必 须 重 视 对 于 一 步 向 前 预测 分 
布 形状 的 观察 . 举 个 例子 ， 假 如 预测 分 布 是 多 模 态 的 或 者 偏 度 很 大 ， 则 一 步 向 前 预测 均值 就 不 
一 定 是 好 的 点 预测 量 ， 一 个 通用 的 方法 是 构造 Y + 的 95 站 预测 区 间 ， 例 如 定义 区 间 为 B 个 模 
拟 值 的 第 2. 5 百 分 位 数 到 第 97. 5 百 分 位 数 . 
通过 递 推 非 线性 自 回归 模型 ， 对 任意 整数 [三 2， 易 推广 模拟 法 来 求 出 # 步 向 前 预测 分 布 : 
Yui = ACY, en) 
Yas BA pirena) 
。 c15. 9. 2) 
Y ae = ACY ge Que) 
HR Y, = yo emoe st ue) 是 从 误差 分 布 抽样 得 到 的 《个 值 的 随机 样本 .该 过 程 可 以 重复 
BK, 得 到 # 步 同 前 预测 分 布 的 随机 样本 ， 使 用 该 样本 可 以 计算 Y,;, 的 预测 区 间或 者 其 他 任意 
预测 的 描述 统计 量 . 
实际 上 ，2 元 组 CY Yu) 是 首 个 4 步 向 前 预测 的 联合 预测 分 布 的 一 个 实现 ， 因 此 ， 
通过 上 述 过 程 实际 求 出 的 是 来 自首 个 4 步 向 前 预测 联合 预测 分 布 的 B 个 向 量 的 一 个 随机 样本 . 
本 节 后 续 部 分 将 着 重 讨论 真实 模型 是 TAR 模型 时 的 预测 问题 所 幸 在 TAR 模型 下 ， 一 
步 向 前 预测 分 布 的 计算 无 需 使 用 模拟 法 ， 下 面 用 一 阶 TAR 模型 的 简单 情况 予以 说 明 . 此 时 
Ys 已 知 ， 因 此 YY 所 在 区 域 已 知 ， MEY. usr, BAY .i5 ARC) 模型 推出 
Yna = Bo 二 BY, taer (15.9.3) 
HAY =», ERER RY WADE hio Thin, AEA of 的 正 态 分 布 ， 类似 
H, WRY Or, Yn AEKA ARC) 模型 ， 因 此 条 件 分 布 是 均值 为 bo thay HRA 
of 的 正 态 分 布 。 同 理 可 得 ， 任 意 TAR 模型 的 一 步 向 前 预测 分 布 都 是 正 态 的 ， 但 预测 的 均值 是 
分 段 线性 函数 ， 预 测 的 标准 差 逐 段 为 常数 . 
类 似 可 证 ， 如 果 4 委 a， 那 么 TAR 模型 的 2& 步 向 前 预测 分 布 亦 为 正 态 的 . BE ed, Me 
步 向 前 预测 分 布 将 不 再 是 正 态 分 布 ， 这 可 用 4d 二 1]，f 二 2 的 一 阶 TAR 模型 简单 地 予以 说 明 . E 
PRY AY. 的 观测 值 所 决定 的 一 个 固定 的 线性 模型 但 Y + 究竟 落 于 下 区 域 还 是 上 区 域 
是 依赖 于 Y,4; 的 随机 取 值 的 ,假设 y Sr Y AE TER P RIRE Yo Soes TA tA, 
yr, HEERKE p, = Prl em tho thay<r)» HRT 
Yue = dien: 十 页 十 页 Ya = diem: + Poe 十 由 ,1 页。 十 页 1 十 页 。 (15. 9. 4) 
服从 均值 等 于 Aih tAn tho. BREF it 的 正 态 分 布 ， 男 一 方面 ，Yi+1 落 在 上 区 域 
的 概率 是 1 一 户 ， 此 时 Y;; 的 条 件 分 布 是 正 态 分 布 ， 但 均值 为 ba Cio Tham) Hho AEFT 
展 十 过:oj， 因 此 ，Y-+s 的 条 件 分 布 是 两 个 正 态 分 布 的 混合 ， 注 意 混合 概率 p 依赖 于 y,。 特 别 地 ， 
如 果 >d, W) TAR 模型 的 高 阶 向 前 预测 分 布 非 正 态 ， 故 寻找 预测 分 布 需 诉 请 模拟 方法 . 
作为 一 个 例子 ， 下 面 就 对 数 化 变换 之 后 的 捕食 者 数据 基于 用 4d=3 的 拟 合 TAR(2; 1，4) 模 
型 来 计算 其 预测 区 间 ; 见 图 表 15-22， 其 中 中 间 的 虚线 是 预测 分 布 的 中 位 数 ， 其 他 的 虚线 是 预 
测 分 布 的 第 2. 5 百 分 位 数 和 第 97. 5 百 分 位 数 . 
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图 表 15-22 ”捕食 者 序列 预测 


Log 捕食 者 


> set.seed (2357125) 

> win.graph(width=4.875,height=2.5,pointsize=8) 

> pred. predator=predict (predator.tar.1,n.ahead=60,n.sim=10000) 

> yy=ts(c(log(predator.eq) ,pred.predator$fit) ,frequency=2, 
start=start (predator.eq) | 

> plot (yy, type='n', ylim=range(c(yy,pred.predator$pred.interval)), 
ylab='Log Predator',xlab=expression(t)) 

> lines (log(predator.eq) ) 

> lines (window (yy, start=end(predator.eq})+c(0,1)),1lty=2) 

> lines (ts (pred.predatorSpred.interval [2,], 
start=end (predator.eq)+c(0,1),freq=2) ,lty=2) 

> lines (ts (pred.predatorSpred.interval [1,1], 
start=end (predator.eq)+c(0,1),freq=2), lty=2) 


这 里 模拟 的 规模 为 10 000 次 ， 而 实践 中 如 1000 次 那 种 较 小 的 规模 也 许 已 足够 了 .预测 分 
布 的 中 位 数 可 以 作为 点 预测 量 ， 注意 ， 开 始 时 预测 中 位 数 反映 出 了 捕食 者 数据 的 循环 模式 ， 而 
随 着 步 数 的 增加 将 趋 于 长 期 中 位 数 ， 类 伏地， 预测 区 间 将 趋 于 拟 合 TAR 模型 平稳 分 布 的 第 
2.5 百 分 位 数 和 第 97.5 百 分 位 数 ， 但 有 一 个 新 的 特点 ， 即 预测 的 不 确定 程度 并 不 随 预 测 步 数 
的 增加 而 放大 ， 概 因 预 测 区 间 并 不 是 关于 预测 步 数 单调 增长 的 ， 见 图 表 15-23. 这 与 ARIMA 
模型 有 根本 区 别 ， 后 者 的 预测 方差 总 是 预测 步 数 的 增 函 数 . 

图 表 15-23 95% 预测 区 间 宽 度 相对 前 置 时 间 的 关系 图 


Fa 
Ln 


预测 区 间 宽 度 
一 hu 
wo S 


1.0 


0 10 20 30 40 50 60 
向 前 步 数 


> plot (ts (apply (pred.predator$pred.interval,2, 
function (x) {x[2]-x[1]})), 
ylab='Length of Prediction Intervals', 
xlab='Number of Steps Ahead') 
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前 面 说 过 ，TAR 模型 的 预测 分 布 是 正 态 分 布 的 充 要 条 件 是 向 前 预测 的 步 数 {三 4， 图 表 
15-24 给 出 了 三 步 向 前 预测 分 布 的 正 态 得 分 QQ 图 ， 可 见 该 曲线 相当 地 直 . 男 一 方面 ， 六 步 问 
前 预测 分 布 的 正 态 得 分 QQ 图 ( 见 图 表 15-25) 与 非 正 态 性 相 容 . 


图 表 15-24 三 步 向 前 预测 分 布 正 态 QQ 图 


样本 分 位 数 


4.0 -o 


(9) 


-4 4 


-2 0 2 
理论 分 位 数 


> win.graph (width=2.5,height=2.5,pointsize=8) 
> qqnorm(pred.predator$pred.matrix[,3]) 
> qqline(pred.predator$pred.matrix[,3]) 


图 表 15-25 六 步 向 前 预测 分 布 正 态 QQ 图 


理论 分 位 数 


> qqnorm(pred.predatorSpred.matrix[,6]) 
> qqline (pred.predator$pred.matrix[,6]) 


15.10 小结 


本 章 介绍 了 一 类 重要 的 非 线 性 时 间 序 列 模型 一 一 门限 模型 ， 证 明了 如 何 对 非 线性 ， 特 别 是 
门限 非 线 性 进行 检验 . 之后， 介绍 了 使 用 最 小 AIC(MAIC) 准则 及 条 件 最 小 二 乘法 估计 模型 
未 知 参数 的 相关 问题 . 如 同 所 有 模型 一 样 ， 本 章 也 学 习 了 如 何 通过 各 种 诊断 检验 ， 包 括 扩 展 的 
混合 检验 来 评价 模型 的 方法 . 最后， 说 明了 如 何 根 据 门限 模型 作出 预测 ， 包 括 对 预测 区 间 的 计 
算 和 显示 . 对 所 论 及 的 方法 和 技术 ， 本 章 还 给 出 了 若干 实例 . 


习题 
15.1 对 捕食 者 序列 拟 合 一 个 延迟 设 定 为 2 的 TAR 模型， 并 用 Stenseth 等 (1998，1999) 给 
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EOC 


出 的 框架 解释 结 采 . (读者 也 许 想 先行 检验 他 们 的 框架 对 TAR 模型 来 说 是 否 近 似 有 
效 ,) 另外 ， 比 较 拟 合 模型 与 教材 中 延迟 为 3 的 TAR(2: 1, 4) 模型 ，( 数 据 文 件 名 为 
veilleux. ) f 

对 开 方 变换 后 的 太阳 黑子 数据 拟 合 一 个 TAR 模型 ， 并 检验 拟 合 优 度 .， 解释 该 拟 合 TAR 
模型 . 〈 数 据 文件 名 为 spots. ) 

使 用 习题 15. 2 中 的 拟 合 模型 预测 未 来 10 年 里 的 年 相对 太阳 黑子 数 ， 画 出 预测 区 间 和 预 
测 的 中 位 数 . (数据 文件 名 为 spots. ) 

对 于 相对 太阳 黑子 数 拟 合 模型 ， 考 察 其 骨架 的 长 期 行为 ， 拟 合 模型 看 起 来 平稳 吗 ? 解释 
你 的 结果 . | 

根据 相对 太阳 黑子 数据 的 拟 合 TAR 模型 ， 模 拟 一 个 长 度 1000 的 序列 ， 计 算 模拟 实现 的 
谱 ， 并 与 数据 的 谱 进 行 比 较 . 拟 合 模 型 抓 住 了 数据 的 相关 结构 没有 ? 

画 出 经 开 方 变换 的 野 免 数据 的 滞后 回归 图 ， 有 无 迹 象 表明 野兔 数据 是 非 线 性 的 ?数据 
文件 名 为 hare. ) 

对 野兔 数据 进行 正式 的 非 线 性 检验 (Keenan 的 检验 、Tsay 的 检验 和 门限 似 然 比 检验 ). 
野兔 丰 度 过 程 是 不 是 非 线 性 的 ? 解释 你 的 结果 . (数据 文件 名 为 hare. ) 

假设 野 免 数据 是 非 线性 的 ， 对 其 拟 合 一 个 TAR 模型 ， 并 检验 拟 合 优 度 . (数据 文件 名 
为 hare. ) 

本 题 假设 读者 熟悉 马尔 科 夫 链 理 论 ， 考 虚 如 下 简单 的 分 段 常数 TAR 模型; 

[ee 二 ge Yi 过 

[Bao tore Ym >r 

其 中 (e) the AILS RR. RY. <r, OR=1, PMR =2, RS 
RERE. 

(a) OR R, 的 转移 概率 矩阵 及 其 平稳 分 布 . 

Cb) 推导 (Y) 的 平稳 分 布 . 

(c) R TAR 过 程 的 1 阶 滞后 目 协 方差 . 


Y, = 


附录 L TAR 广义 混合 检验 


混 


合 检验 基于 以 下 结论 : 如 果 正 确 设 定 了 TAR 模型 , A, pet ,pn 渐 近 服从 均值 为 0、 


DWH Cova, 6) 一 好 的 联合 正 态 分 布 HS Qk mXm 的 和 矩阵， 其 第 G, j) 元 素 等 于 
gj， 公式 给 出 如 后 ; Chan(2008) 已 证 明 . 可 证 Q=I—UV'U', Hm I 是 mXm 单位 


和 矩阵. 


Hp I, 


E-i 
U=E [e-+ LL, Ya TY ola (1 — Ep) Ya DY R 
pa 


=] (Y ar), EENAA EEA nR aa RAAR, H 
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I, ] 
Y I, 
Yi, 


V=E (1 L) LLY lY l ad I), Ya d I) Y, Pe G a PO 


Ym (d I.) 


Y.,,(l1—1,) 
通过 用 标准 化 残 差 替换 真实 误差 并 用 估计 值 替换 未 知 参 数 ， 所 计算 出 的 样本 平均 可 用 来 逼近 上 
述 期 望 值 . 例如 ， E {e1 ICY, Jr 可 用 下 式 通 近 : 


二 >) aY < 
i=] 


Hip) ka be HER 222, =0, t<max(p\, pr» d). 
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引言 

本 书 所 有 的 图 形 和 数值 输出 都 是 用 R 软件 产生 的 ， 该 软件 可 免费 从 关于 统计 计算 的 民 计 
划 (R Project for Statistical Computing) 获得 . R 软件 的 源 代 码 格 式 符 合 自 由 软件 基金 会 
GNU 通用 公共 许可 证 规定 .该 软件 可 以 在 多 种 操作 系统 中 运行 ， 例如 Windows, Mac OS, 
UNIX 以 及 类 似 系 统 ， 包 括 FreeBSD 和 Linux. R 是 用 于 统计 计算 和 绘图 的 语言 与 环境 ， 提 供 
了 相当 广泛 的 统计 方法 (时间 序 列 分 析 、 线 性 和 非 线 性 建 模 、 经 典 统计 检验 ， 等 等 ) 及 绘图 技 
术 ， 并 具有 很 强 的 扩展 性 ， 特 别 是 本 书 作 者 之 一 KSC) 编写 了 大 量 新 的 或 增强 的 R 函数 ， 专 
门 与 本 书 所 描述 的 方法 相配 套 ， 相 关内 容 可 以 通过 访问 及 计划 网 址 : www. r-project. org, M 
名 为 TSA 的 R 程序 包 中 下 载 . TSA 函数 的 有 关 说 明 见 本 书 337 HIR. 

通过 访问 R 计划 网 址 可 以 得 到 进一步 学 习 R 的 重要 参考 资料 ， 包 括 ; “An Introduction to 
R.: Notes on R, a Programming Environment for Data Analysis and Graphics. ”版 本 2.4.1 
(2006-12-18), Hy W. N. Venables, D. M. Smith M R 开发 核心 小 组 CR Development Core 
Team) (2006) 45, LAR “R: A Language and Environment for Statistical Computing 
Reference Index,” fis 2.4.1(2006-12-18)， 由 R 开 发 核心 小 组 (2006a) 编写 . 

R 软件 是 著名 S 语言 的 GNU 应 用 . 该 软件 在 R 小 组 和 世界 各 地 许多 统计 学 家 的 贡献 下 发 
展 非常 活跃 ， 已 经 形成 了 一 个 功能 多 样 且 强大 的 统计 分 析 平 台 . 我 们 仅 就 Windows 版 本 下 的 
R 进行 讨论 ， 如 需要 下 载 该 软件 ， 可 访问 网 址 ，www. rproject.org. 点 击 屏 幕 左 侧 Download 
下 的 CRAN， 滚 动 CRAN 镜像 地 址 列表 ， 点 击 距离 你 地 理 位 置 最 近 的 网 站 .点击 Windows 版 
本 链接 (此 处 ， 可 适当 地 选择 Linux 或 MacOSX) 并 点 击 名 称 为 base 的 链接 ， 最 后 ， 点 击 名 
为 R-2. 6. 1-win32. exe 的 链接 (该 文件 表明 版 本 为 2. 6. 1 版 ， 是 写本 书 时 的 最 新 版 本 .版 本 更 
新 非常 频繁 )， 将 该 文件 保存 到 方便 的 位 置 ， 例 如 桌面 上 ， 在 下 载 完 成 后 ， 双 击 程序 图 标 进行 
软件 安装 〈 下 面 的 讨论 假设 在 安装 过 程 中 接受 所 有 的 默认 设置 )， 在 本 附录 的 最 后 ， 可 以 找到 
包含 在 TSA 包 中 所 有 新 的 或 增强 型 本 数 的 列表 及 简单 描述 . 

在 第 一 次 运行 R 软件 前 ， 需 要 创立 一 个 文件 夹 或 目录 ， 例 如 Rwork， 用 以 保存 用 R 软件 
完成 本 项 目 或 课程 时 用 到 的 数据 文件 ， 无论 何 时 ， 用 R 完成 该 特殊 项 目 或 课程 时 ， 该 目录 都 
将 成 为 工作 目录 . 这 一 目录 包含 名 为 workspace 的 文件 ， 该 文件 包含 所 有 Raw 
中 所 创建 的 对 象 (变量 和 函数 )， 应 该 对 不 同 项 目 和 课程 建立 不 同 的 工作 目录 . 
在 电脑 上 成 功 安 装 RR 后 ， 桌 面 上 将 会 出 现 一 个 R 的 快捷 图 标 ， 如 果 已 经 创建 了 工作 目录 ， 
么 可 以 点 击 R 图 标 开 始 使 用 R (如 右 侧 图 形 所 示 )， 在 软件 加 载 之 后 ， 会 出 现 一 个 与 图 表 1 所 
示 类 似 的 控制 台 窗 口 ， 在 窗口 底部 显示 记 和 一 个 大 号 的 矩形 光标 (可 能 是 红色 )， 这 就 是 RR 的 
Hae. TLE RAR AAS, Mia Enter 键 后 命令 被 执行 ， 某 些 任务 可 以 通过 葬 单 栏 


O ”如果 在 共享 的 计算 机 实验 室 中 操作 ， 询 问 实验 室 管 理 员 如 何 启动 R 和 保存 你 的 工作 . 
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执行 . 


首 个 任务 就 是 在 创建 的 工作 目录 中 保存 工作 区 (workspace). 完成 这 一 工作 ， 需 要 选择 
File 菜单 ， 然 后 点 击 选 项 Save workspace:'?. 此 时 ， 可 以 通过 浏览 


的 方式 (可 能 需要 多 个 步 又 ) 找到 创建 的 Rwork 目录 ， 或 录 人 完整 的 路 
径 ; fa, “C: \ Documents and Settings \ JoeStudent \ My Documents \ 
Coursel56 \ Rwork"”， 如 采 工 作 目 录 保 存在 USB 闪存 中 ， 且 盘 符 为 下 ， 那 
么 仅 需 输 人 “ERwork”， 并 点 击 OK， 此 后 在 这 次 会 话 中 ，R 将 用 
Rwork 文件 夹 作 为 其 工作 目录 ， 

可 以 通过 选择 File 菜单 中 的 exit BHR. 在 每 次 退出 RA, MA 
收 到 一 个 是 否 保 存 工 作 区 映像 (whether or not to Save the workspace 
image) 的 询问 ， 点 击 ves 保存 工作 区 ， 工 作 区 将 会 保存 在 当前 的 工作 目 
录 中 .下 次 ， 当 和 希望 继续 处 理 同 一 项 目 时 ， 仅 需 寻 找到 该 工作 目录 , 将 RR 
图 标 午 加 在 名 称 为 . RData 的 文件 上 即 可 ， 如 果 双 击 这 一 图 标 ，R 将 会 启 
动 ， 并 将 已 选 目 录 作 为 工作 目录 ， 此 时 可 以 对 该 项 目 进 行 操作 . 此 外 ， 还 


会 接 到 信息 “Previously saved workspace restored”, 


Load History... 


Source R code... 
New script 
Display file(s)... 


Load Workspace... 
Save Workspace 


Bi i 


Save History... 


Print... 
Save to File... 


Exit 


图 表 1 展示 了 打开 R、 制 作 两 个 不 同 图 形 、 在 脚本 窗口 中 应 用 R 的 编辑 器 运行 R 命令 后 
可 能 出 现 的 屏幕 显示 .在 R 中 ， 数 值 结果 显示 在 控制 台 窗 口 ， 命 令 可 以 通过 输入 RAD 控 
制 台 窗口 被 直接 执行 ， 或 (更 优 的 ) 输入 到 脚本 窗口 〈R 编辑 器 ) 然后 提交 在 R 中 运行 ， 菜单 


条 及 按钮 会 根据 当前 “关注 ”窗口 的 变化 而 变化 . 
HEI R 软件 Windows 图 形 用 户 界 面 


b piira q 2 | lj hi 7 | ae As a i s | 
nena TE e wu Abi n J, ER + 2 8s 
ee i 
i E iE = 1 1HE e 
A i 


console window | {active graph window 


iinactve} graph winti 


< Sinipi window 


O ”如 果 在 运行 民 以 前 忘记 了 创建 工作 目录 ， 可 以 此 时 再 创建 . + RAAMHME. Adr Create new folder 按 钮 “|, 


并 创建 一 个 Rwork 文件 夹 . 
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人 最 有 用 的 特性 之 一 就 是 它 可 以 轻松 地 加 载 以 库 或 者 包 形 式 存在 的 补充 工具 .例如 ， 本 书 
使 用 的 所 有 的 数据 集 以 及 新 的 或 增强 型 的 R 函数 都 被 集中 在 名 为 | Packages | 
TSA 的 包 中 ， 可 以 下 载 并 且 在 RR 中 安装 .安装 方法 是 ， 点 击 Load package 
Packages 菜单 ， 选 择 set CRAN mirror (RA LAD. WERE 


Sect repositories... 


你 地 理 位 置 最 近 的 镜像 地 址 ， 此 时 会 弹出 一 个 包含 所 有 可 用 程序 install package{s). 


Update packages... 


包 和 名 称 的 窗口 . 

除了 TSA 包 ， 还 需要 安装 其 他 程序 包 ， 包括 leaps. 
locfit.MASS.mgcv.tseries.uroot. 再 次 点 击 Packages 菜单 . Co . 
点 击 Install package (s) ( 见 右 下 图 )， 滚 动 窗口 ， 按 住 Ctrl 键 
并 分 别 点 击 7 个 包 的 名 称 . 当选 择 全 部 7 个 包 后 ， 点 击 OK, Ef Select repositories. .. 
会 被 R 装 入 你 的 系统 中 . 这 些 程序 包 仅 需 安装 一 次 即 可 . (当然 ， Update packages $ 
这 些 包 将 来 可 能 会 更 新 ， 并 且 其 中 的 一 些 可 能 被 并 人 R 的 核心 部 est gatha fariani sip ine. 
AARM RR) l 

我 们 将 从 头 到 尾 介 绍 各 章 出 现 的 命令 作为 R 的 一 个 教程 ， 但 是 在 开始 之 前 给 出 R 的 简介 . 
R 是 一 个 面向 对 象 的 语言 . R 中 两 个 主要 对 象 是 数据 和 隔 数 ，R 可 以 接受 多 种 类 型 的 数据 结 
MW. 最 简单 的 数据 结构 是 包含 原始 数据 的 向 量 . 为 创建 一 个 名 为 Dat HES EA 31，4，15， 
93 的 数据 向 量 ， 需 要 在 控制 台 窗 口 的 二 提示 符 后 键入 如 下 命令 : 

Dat=c(31,4,15,93) 
然后 按 回 车 键 . 等 号 意味 着 将 右 侧 的 对 象 赋值 给 左 侧 对 象 . 表达 式 c (31, 4,15, 93) 表 示 将 括 
号 内 的 数字 连接 在 一 起 构造 一 个 向 量 ， 因 此 命令 创建 了 一 个 名 字 为 Dat 的 对 象 ， 该 对 象 是 包 
31, 4, 15, 9 的 向 量 ，R 对 符号 敏感 ， 因 此 名 为 Dat 和 Dat 的 对 象 是 不 同 的 .要 显示 对 
象 的 内 容 ， 只 需 键 和信 对象 名 称 ， 并 按 回 车 键 。 因 此 在 R 的 控制 台 窗 口 键 入 Dat (并 按 回 车 键 ) 
将 会 显示 Dat 的 内 容 ， 如 果 接 着 在 R 的 提示 符 后 输入 DaAt， 程 序 将 会 返回 一 条 错误 信息 “对 
象 "Dat "未 找到 ”来 提示 错误 .对 象 的 名 称 是 字符 串 ， 可 以 包 会 字母 、 数 字 或 者 周期 性 符号 ， 
但 是 首 个 字符 必须 是 字母 S， 例如 ，Abc123. a 对 于 R 来 说 就 是 一 个 有 效 的 对 和 象 名 称 ， 但 12a 
则 不 是 。R 有 一 些 有 用 的 内 置 对 象 ， 例 如 pi, 代表 三 角 函 数 运 算 中 例如 计算 圆 的 面积 ) 用 
到 的 x 值 . 

对 我 们 来 讲 最 有 用 的 数据 结构 是 时 间 序 列 ， 一 个 时 间 序 列 实际 上 就 是 一 个 包括 一 些 额 外 信 
息 的 向 量 ， 这 些 信息 包括 : 首 个 数据 发 生 的 日 期 ， 在 基础 的 单位 时 间 长 度 上 数据 的 个 数 〈 即 频 
率 ， 译 者 注 )， 例 如 ， 假 设 我 们 有 从 2006 年 第 二 季度 开始 的 季度 数据 : 12，31，22，24，30. 
这 一 时 间 序 列 可 以 通过 以 下 方式 创建 : 

> Dat2=ts(c(12,31,22,24,30),. start=c(2006,2), frequency=4) 
其 内 容 可 以 通过 以 下 命令 核对 : 

> Dat2 

Otri Qtr2 Qtr3 Otr4 


Instali package (s) from lacai np fles,. 


名 ”应 该 避免 使 用 某 些 名 称 ， 因 为 它们 在 R 中 有 特殊 的 意义 .例如 字母 工 是 真 值 的 缩写 ，F 是 假 值 的 缩写 ，C 是 连接 或 
者 合并 的 缩写 . 
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已 经 保存 在 数据 文件 中 较 大 的 数据 集 〈 原 始 数据 用 空格 、 制 表 符 或 线 隔 开 ) 可 通过 以 下 命 
令 输 人 到 R: 

> Dat2=ts(scan('filel'), start=c (2006,2), frequency=4) 
此 处 ， 我 们 假设 数据 包含 在 名 为 filel 的 文件 中 ， 该 文件 保存 在 启动 R 时 使 用 的 日 录 (或 者 
保存 在 通过 change dir 命令 改变 到 的 目录 )， 注 意 文件 名 filel 用 单 引号 (') 括 起 来 . HER 
中 ， 所 有 字符 变量 必须 被 括 起 来 ,但 是， 可 以 使 用 单 引 号 也 可 以 使 用 双 引 号 ， 只 要 它们 成 对 出 
BL BD ay. 

包括 多 个 变量 的 数据 集 可 以 用 read. table MRA R. 但 数据 必须 被 储存 在 一 个 表格 形 
式 中 : 首 行 包含 变量 名 ， 第 二 行 开始 是 数据 ,数据 排列 的 方式 是 每 次 观测 排 成 一 行 ， 并 且 是 按 
照 变量 名 称 顺 序 排列 ， 相 关 命 令 是 : 

Dat3=read.table('file2',header=T) 
其 中 file2 是 包含 数据 的 文件 名 ， 参 数 header= 了 T 设 定 变量 名 在 文件 的 第 一 行 ， 例如 令 工 作 
目录 中 名 为 file2 的 文件 内 容 如 下 : 


Fa 
a 


3=read.table('file2',header=T) 
a 


VV Ul Wwe 


U ob wW He H OD Dm 
w A 


t 
t 
A 
2 
7 
B 
9 


B Wh e 


注意 在 Dat3 的 显示 中 ，R 添加 了 一 个 行 标 ， 上 默认 从 1 到 数据 的 个 数 . read table 的 输出 结果 
是 data. frame， 是 一 种 对 应 数据 表格 的 数据 结构 ， 更 多 关于 read table 的 讨论 可 在 以 后 找到 ， 现 
在 只 需 记 住 在 data. frame 中 的 变量 是 不 能 使 用 的 . 用 Dat3 作为 一 个 完整 的 例子 .在 其 变量 进 能 够 
在 R 会 话 中 使 用 前 ，Dat3 必须 被 打开 ， 而 这 个 “打开 ”data, frame 的 命令 就 是 attach: 

> Y 


Error: object "Y" not found 
> attach (Dat3) 


> X 

[1] 276 9 

R 也 可 以 从 以 csv (comma-separated values， 用 如 号 分 隔 的 数据 ) 格式 保存 的 Excel 文件 
中 读 取 数据 ， 该 文件 的 第 一 行 必 须 是 变量 名 ， 假 设 file2. csv GALER, 该 工作 表 与 
file2 拥有 相同 的 信息 .从 file2. csv 中 读 取 数据 的 命令 与 从 文本 文件 中 读 取 数据 的 命令 是 
类 似 的 : 


>» Dat4=read.csv('file2.csv',header=T) 
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PX scan, read table UR read csv 还 有 许多 其 他 有 用 的 选项 ， 使 用 R 的 帮助 文件 可 以 了 解 
更 多 关于 它们 的 信息 例如， 运行 命令 ? read table， 一 个 显示 有 read table 命令 详细 信息 的 窗 
口 将 会 打开 记 住 ,在 任何 函数 名 前 面 加 上 问号 ， 将 会 在 一 个 新 的 窗口 显示 该 函数 的 详细 信息 . 

R 中 的 函数 类 似 于 C 语言 中 的 本 数 .一 个 函数 通过 键入 函数 名 称 ， 并 在 之 后 输入 一 系列 用 
括号 括 起 的 参量 进行 调用 ， 例 如 ， 连 接 函 数 的 名 称 为 “c”， 其 目的 在 于 通过 连接 函数 中 的 参数 
创立 一 个 向 量 . 

> ¢c(12,31,22,24, 30) 

需要 注意 的 是 在 函数 名 称 与 左 侧 的 括号 之 间 没 有 空格 . 即使 参数 列表 为 空 ， 在 调用 函数 时 
括号 也 必须 包含 在 命令 中 ， 试 一 下 以 下 命令 : 

> c 

R 现在 读 到 对 象 的 名 称 ， 将 会 在 控制 台 窗 口 显示 出 编制 该 函数 的 全 部 语句 ，R 拥有 很 多 有 
用 的 内 置 函 数 ， 包 括 abs,10g,10g10,exp,sin,cos,，sqrt， 等 等 ， 这 些 函 数 对 于 数据 整理 十 
分 有 用 . (函数 abs 用 以 计算 绝对 值 ; log 进行 以 e 为 底 的 对 数 变 换 ，1log10 进行 以 10 AEN 
对 数 变 换 ; exp 是 指数 函数 ; sin 和 cos E= fRA; 而 sart 计算 平方 根 ) 这 些 函 数 以 逐个 
作用 于 每 个 元 素 的 方式 对 向 量 或 者 时 间 序 列 进 行 运算 ， 例 如 ，1log (Dat2) 就 是 对 时 间 序 列 
Dat2 的 每 个 元 素 进 行 对 数 变换 ， 并 且 将 时 间 序 列 结构 传递 给 变换 后 的 数据 . 

> Dat2=ts(c(12,31,22,24,30), start=c (2006,2), frequency=4) 

> log (Dat2) 

Qtr1 Otr2 Qtr3 Otr4 


2006 2.484907 3.433987 3.091042 
2007 3.178054 3.401197 


此 外 ， 向 量 和 时 间 序 列 还 可 以 通过 逐个 作用 于 每 个 元 素 的 方式 ， 应 用 一 般 的 加 (十 )、 减 
(~) R), R OO RA (或 * * ) 等 运算 进行 代数 变换 . 例如 ， 对 Dat2 WHER y= 
2x*3 一 x 十 7， 并 把 变换 后 的 数据 保存 到 一 个 名 为 new. Dat2 的 新 时 间 序 列 中 ， 命 令 如 下 : 


new.Dat2= 2*Dat2^3-Dat2+7 


第 1 章 R 命令 


现在 我 们 开始 讨论 选取 于 本 书 第 1 章 中 用 到 的 有 关 RAS. 应 用 在 本 书 全 部 15 章 中 的 命 
今 脚本 文件 可 以 在 以 下 网 址 下 载 : www. stat. uiowa. edu/~ kchan/TSA. htm. 


ait 。 这 些 脚 本 文件 包含 各 章 中 执行 分 析 任务 时 所 需 的 相关 R 命令 ， 同 时 也 包含 一 
些 额 外 的 有 限 的 解释 说 明 . 请 下 载 脚 本 并 将 它们 保存 在 你 的 工作 目录 中 . 可 

ee, 以 通过 R 编辑 器 〈 脚 本 ) 窗口 在 R 中 打开 它们 ， 这 样 将 节省 大 量 录入 工作 ! 

— UEFE. BAR SCE AY BA Ga A a ST FF a, Ze A 

cove tienes... 所 示 那 样 应 用 file 菜单 打开 . 

Se 图 表 2 在 脚本 窗口 中 显示 了 第 1 章 中 脚本 文件 的 部 分 内 容 ， 前 四 行 命令 

Seve we. 已 经 被 用 鼠标 拖拉 选中 的 方式 突出 显示 ， 我 们 现在 可 以 通过 按 Ctrl-R 的 方式 


ea 或 者 是 如 下 右 图 所 示 用 右键 单 击 突出 显示 部 分 ， 并 从 显示 的 选项 中 选择 Run 
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来 运行 .如 果 光 标 停留 在 一 行 没 有 突出 显示 的 命令 处 ， 那 么 该 命令 也 可 以 通过 类 似 方式 执行 . 
图 表 2 显示 第 1 章 脚本 文件 的 脚本 窗口 


EA TE A a e E E A a BETRE OREERT AN 


EPERE EEEE De pp 
i Ciments and ACS on ryer hy Uoc iments: ime wriet Andlyst 
A 


| jwin. graph {width=3, height=3,pointsize=8) Lirads Cii+F 


Plot (y=larain, e™=tlag(larain), ylab@='"Inches', wlab="Previous Year Inches: 


Cut Chl+x 
Copy CTE 
Faste Chrl+v | 

Delete 

Ipilot (color, ylab="Color Property!" ,Elab='Batch', type='o'}) 

| Select al Ctrl+A 


iei 


R 每 次 会 话 开 始 时 ， 都 需要 加 载 TSA 库 ， 下 面 的 命令 可 以 完成 这 项 任务 ，( 但 是 你 也 许 希 
望 了 解 可 以 自动 执行 一 些 启动 任务 的 .First 函数 ) 

library (TSA) 
TSA 包 包 含 所 有 的 用 于 重复 书 中 的 分 析 及 完成 习题 所 需 的 数据 集 和 了 晴 数 . 

# Exhibit 1.1° 

win.graph (width=4.875,height=2.5,pointsize=8) 

在 R 的 代码 编写 过 程 中 ， 可 以 插入 批注 以 增加 其 可 读 性 . 在 命令 中 符号 # 意 味 着 其 后 
的 内 容 仅 仅 是 批注 ， 因 此 R 将 会 忽略 该 部 分 ， 以 # 号 开始 的 首 条 R 命令 是 批注 .第 二 条 R 命 
令 ， 用 于 打开 一 个 图 形 窗口 ， 其 窗口 宽 4.875 英寸 ,高 2.5 英寸 ， 且 字号 为 8 号 .所 选 设置 及 
类 似 设置 得 到 适合 本 书 版 面 的 时 序 图 .为 达到 其 他 目的 ， 另外 的 设置 可 能 更 合适 例如， 分 位 
数 一 分 位 数 图 中 最 好 使 用 1 : 1 的 比例 (长 二 宽 ). 在 探索 性 数据 分 析 时 ， 会 希望 一 个 更 大 的 图 
形 窗 口 以 完全 利用 电脑 屏幕 观察 更 多 的 细 闻 ， 人 节令 win. graph 可 以 放心 地 完全 去 抒 ， 如 采 没 
有 打开 图 形 窗 口 ， 只 要 输入 画图 命令 ，R 就 会 打开 图 形 窗 口 . 可 以 照例 通过 拖 搜 边框 或 者 对 角 
的 方式 调整 窗口 的 大 小 . 

data (larain) 

该 命令 将 larain 时 间 序 列 加 载 到 R 会 话 之 中 ， 为 进一步 分 析 做 准备 ， 例 如 

plot (larain, ylab='Inches',xlab='Year',type='o') 

plot 是 一 个 图 数 ， 用 于 绘制 出 larain 的 时 序 图 .参数 ylab= 'Inches' 指 明 以 “Inches” 
作为 vy 轴 的 坐标 ， 同 样 ，z 轴 的 坐标 为 “Year”.。 参数 type 指明 数据 在 图 形 中 的 显示 方式 . 
type= !o" 表 示 每 一 个 数据 点 都 登 加 在 曲线 上 ; type= 'b' 是 男 一 选项 ， 表 示 在 曲线 上 全 加 数据 
点 ， 但 该 曲线 在 数据 点 附近 是 断 开 的 ; type= '1' 表 示 只 显示 各 数据 点 之 间 的 连接 线段 ( 注 ; 此 
处 字符 1 是 英文 小 写字 母 ， 而 并 非 是 1)， 只 想 显示 数据 点 ， 令 type= 'p' 即 可 .如 有 果 想 了 解 玩 多 
关于 plot 函数 的 信息 和 type 参数 的 全 部 选项 ， 运 行 命令 

?plot 


将 会 弹出 plot 函数 的 帮助 窗口 ， 供 你 浏览 ， 现 在 试 一 下 ， 如 果 选 项 为 type='h' 而 不 是 


© Exhibit 1. 1 指 的 是 图 表 1-1， 下 同 . 一 :编辑 注 
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type= 'o'， 那 么 绘图 结果 是 什么 样子 的 ? 所 有 图 形 可 以 保存 为 以 下 几 种 格式 中 的 任意 一 种 
(File> Save as > *):jpeg pdf 等 ， 保 存 好 的 图 形 可 以 导入 大 部 分 文字 编辑 程序 以 得 到 高 
质量 的 报告 . 


# Exhibit 1.2 

win.graph (width=3, height=3,pointsize=8) 
plot (y=larain, x=zlag(larain) ,ylab='Inches', 
Xxlab='Previous Year Inches') 


plot 函数 是 一 种 多 用 途 函 数 ， 依据 设 定 的 参数 及 其 属性 可 以 绘制 多 种 不 同 的 图 形 . 此 时 
通过 设 定 参数 y= larain ( 即 larain 作为 y 轴 ) Al x= zlag (larain)( 即 larain 的 1 Bt 
后 作为 工 轴 )， 该 命令 绘制 了 larain 与 其 1 阶 滞后 之 间 的 散 点 图 . 注意 zlag 是 一 个 在 TSA 
包 中 的 函数 .可 以 运行 命令 ? zlag 了 解 如 何 使 用 . 


# Exhibit 1.3 
data (color) 
plot (color,ylab='Color Property',xlab='Batch',type='o') 


这 里 我 们 给 plot 函数 提供 了 四 个 参数 来 绘制 color 的 时 序 图 .第 一 个 参数 简单 地 只 是 
color， 而 其 他 的 参数 采用 了 “参数 = 参数 值 ”的 形式 .因此 ， 第 一 个 参数 是 未 命名 参数 ， 而 
其 他 参数 是 命名 参数 ， 读 者 也 许 会 对 未 命名 参数 的 R 解读 感 兴趣 ， 为 此 可 以 使 用 ? plot 命令 
来 查看 plot 函数 的 参量 列表 ， 列 表 形 如 x,y,.... 可 以 想到 图 形 中 的 zx 参数 表示 xz 变量 ，y 
参数 表示 y ER. RH...) 代表 其 他 容许 参数 ， 但 必须 用 参数 名 来 设 定 . (重新 查阅 
plot 函数 帮助 页 ， 看 除了 x 与 y 以 外 ，plot 还 设置 了 什么 其 他 参数 ) 任何 未 命名 参数 都 被 解 
读 为 函数 中 相同 位 置 未 命名 参数 的 赋值 ， 例 如 ，color 作为 plot 函数 中 第 一 个 参数 出 现 ， 因 
此 及 将 其 解读 为 z 参 数 的 值 ， 此 例子 中 y 参数 没有 被 代入 ， 这 种 情况 下 ，Plot 将 根据 x 变量 
的 属性 来 决定 采取 何 种 行动 . 因为 color 是 一 个 时 间 序 列 ， 因 此 plot 将 绘制 一 个 关于 color 
的 时 序 图 .为 了 加 深 理解 ， 现 在 试 着 运行 以 下 命令 ， 命 令 中 color 作为 第 一 和 第 二 参数 出 现 
了 两 次 . 


plot(color, color, ylab='Color Property', 
xlab='Batch',type='o') 


猜 一 下 R 将 绘制 一 个 什么 样 的 图 形 ? 现在 color 被 解释 为 x 变量 也 被 解释 为 y Ze, A 
此 会 绘制 出 一 条 45 度 的 直线 ， 但 是 该 直线 的 宽度 并 不 均匀 . 〈 你 能 看 出 这 一 点 吗 ?) 为 什么 呢 ? 
这 是 由 于 该 序列 为 时 间 序 列 ，plot 函数 按照 数据 记录 的 顺序 将 数据 点 进行 连接 ， 并 在 图 中 标 
记 数 据点 的 顺序 ， 这 一 特性 可 用 于 某 些 分 析 中 ， 但 在 本 例 中 却 会 分 散 读 者 的 注意 力 ， 一 种 处 理 
方法 是 在 绘图 之 前 从 z 变量 中 除去 时 间 序 列 属 性 (Plot 函数 将 会 根据 x 变量 的 属性 确定 如 何 
去 绘图 ). 将 color 暂时 转换 为 一 个 原始 数据 向 量 ， 可 使 用 命令 

as.vector (color) 

现在 试 一 下 命令 

plot (as.vector (color), color, ylab='Color Property', 

xlab='Batch',type='o') 
# Exhibit 1.4 - . 


plot (y=color,x=zlag(color),ylab='Color Property', 
xlab='Previous Batch Color Property') 
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zlag M% AA Hy ee PF a AS fo ek. «BY zlagt(color) 是 colozr 的 1 人 阶 滞后 ， 但 是 时 间 序 列 属性 已 
经 被 去 除了 . 


# Exhibit 1.9 
plot (oilfilters,type='1',ylab='Sales') 


plot 是 一 个 高 级 绘图 郴 数 ， 该 命令 将 替代 现 有 图 形 窗口 中 的 信息 ， 或 者 在 没有 图 形 窗 口 的 情 
况 下 创建 一 个 新 的 窗口 .记得 参数 type= '1' 指 示 plot 仅仅 使 用 线段 连接 每 一 个 单独 的 时 间 
序列 点 . 

Month=c('J','A','S','O','N','D', 'J', EM RARALI IMTIJII 
创建 一 个 名 为 Month 的 向 量 ， 包 含 12 个 元 素 ， 分 别 代 表 12 个 月 ， 从 7 月 开始 . 

points (oilfilters, pch=Month) 
points 是 一 个 低级 绘图 函数 ， 仅 在 现 有 图 形 上 绘图 由 于 oilfilters 是 一 个 时 间 序 列 ， 
points 会 依据 时 间 顺 序 绘 制 oilfilters， 但 参数 pch= Month 指示 points pe AX E H 
Month 向 量 的 连续 数值 作为 绘图 符号 以 标 出 数据 点 因此， 图 形 中 的 第 一 个 点 用 J 标识， 第 
二 个 点 用 A， 以 此 类 推 . 当 Month 的 值 用 完 时 ， 循 环 使 用 . 想象 一 下 把 Month 复制 为 
Month, Month, hE zø. 因此 第 13 个 数据 点 用 J 标识 ,第 14 个 是 A， 第 30 个 数据 点 
FATT AF RE? 

此 外 ， 这 一 例子 也 可 以 用 下 面 的 命令 复制 : 


plot (oilfilters,type='1',ylab='Sales') 
points (y=oilfilters,x=time(oilfilters), 
pch=as.vector (season (oilfilters) })) 


当时 间 序 列 数据 被 收集 时 ，time 项 数 输 出 时 期 . season 项 数 返 回 oilfilters 中 数据 的 月 
份 ，season 函数 是 一 个 智能 函数 ， 因 为 它 返 回 季度 数据 数据 点 对 应 的 季度 ， 以 此 类 推 . 参 
数 peh 要 求 用 向 量 作 赋值 ， 但 是 season 函数 的 输出 被 定义 为 factor 对 象 ; 因此 ， 需 要 对 
season (oilfilters) 应 用 as. vector 函数 ， 以 去 除 其 因子 属性 . (KF factor 对 象 的 更 多 
解释 参阅 第 310 一 311 页 ). 

了 解 随 机 过 程 自然 变化 的 最 好 方法 之 一 ， 就 是 对 该 过 程 进 行 抽 样 ， 然 后 绘制 时 间 序 列 图 ， 
例如 ， 独 立 同 分 布 的 正 态 分 布 过 程 经 常 被 用 作 完 全 随机 数据 ( 即 无 时 间 结 构 的 数据 ) 的 数据 生 
成 机 制 ， 换 句 话说， 这 些 数据 构成 了 从 正 态 分 布 中 按时 间 顺 序 抽样 得 到 的 随机 样本 .对 过 程 数 
据 进行 模拟 ， 并 观察 其 时 间 序 列 图 ， 是 一 种 有 价值 的 可 用 于 区 分 时 间 序 列 是 随机 或 与 时 间 相 关 
的 训练 (习题 1. 3)， 对 于 从 标准 正 态 分 布 抽样 ， 模 拟 结果 保存 在 名 为 y 的 变量 中 ， 样 本 容量 
2 一 48， 其 R 命令 是 : 

y=rnorm (48) 

应 用 以 下 命令 对 该 数据 画图 : 

plot(y, type='p', ylab='IID Normal Data') 

在 以 上 命令 中 试 一 下 选项 type= 'o'. 你 觉得 哪 种 选项 便于 更 好 地 观察 数据 的 随机 性 ? 注意 再 
运行 一 次 y= rnorm(48)， 将 会 得 到 随机 过 程 的 另外 一 个 不 同 的 时 间 序 列 实现 . 下 面 讨 论 的 
set. seed 命令 说 明了 如 何在 R 中 进行 “可 复制 ”的 模拟 . 

数据 可 以 从 其 他 分 布 中 进行 模拟 例如， 命令 rt (n= 48, df= 5) 是 从 自由 度 为 5 的 1 分 
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布 中 模拟 48 个 独立 观测 值 . 类 似 地 ，rchisatn= 48,df= 2) 是 从 自由 度 为 2 的 卡 方 分 布 中 模 
拟 48 个 独立 观测 值 , 


第 2 章 R 命令 


我 们 给 出 一 些 R 程序 来 模拟 随机 游 动 过 程 ， 假 设 具 有 60 个 独立 的 标准 正 态 误差 . 
# Exhibit 2.1 
n=60 


将 数值 60 代入 名 为 n HIR. 

set . seed (12345) 

初始 化 随机 数字 生成 器 ， 以 便 在 需要 时 模拟 是 可 复制 的 . 

sim.random.walk=ts (cumsum(rnorm(n)),freq=1,start=1) 

表达 式 rnorm (n) 从 标准 正 态 分 布 中 生成 n 个 独立 数值 . 函数 cumsum 计算 正 态 分 布 样本 
的 累计 和 向 量 ,， 得 到 随机 游 动 的 一 个 实现 .然后 该 随机 游 动 实现 被 赋予 时 间 序 列 属性 ， 并 保存 
在 名 为 sim random. walk HX} P. 

plot (sim. random. walk, type='o',ylab='Another Random Walk') 


绘制 模拟 的 随机 游 动 的 时 序 图 . 


第 3 章 R 命令 


我 们 现在 讨论 第 3 章 中 出 现 的 一 些 RTS. 
# Exhibit 3.1 
data (rwalk) 


该 命令 载 人 时 间 序 列 rwaLlk， 该 序列 是 随机 游 动 的 一 个 实现 . 

modell=l1m(rwalk~time (rwalk) ) 

1m 函数 拟 合 了 一 个 线性 模型 〈 回 归 模 型 ) ， 其 第 一 个 参数 是 公式 .该 公式 是 一 个 包含 波浪 
E (~) 的 表达 式 ， 波 浪 号 左 侧 为 应 变量 ， 右 侧 为 协 变量 或 者 是 解释 变量 〈 如 果 存 在 两 个 或 者 
两 个 以 上 的 协 变 量 可 用 加 号 隔 开 )， 截 距 项 默认 为 包含 在 模型 中 ， 可 以 通过 在 波浪 号 右 侧 加 入 
“一 ]” 去 掉 截 距 项 ， 前 已 述 及 time (rwalk) 可 以 产生 随机 游 动 样本 区 间 内 时 期 的 时 间 序 列 ， 
因此 命令 1m(rwalLk 一 上 time (rwalk)) 对 rwalk 序列 拟 合 了 一 个 时 间 趋 势 回 归 模 型 ， 这 个 拟 合 
模型 被 保存 在 名 为 mode11 的 对 得 中. 

summary (modell) 

summary 函数 打印 输出 传人 modell 的 模型 的 拟 合 结果 汇总 ， 因 此， 以 上 命令 打印 出 对 
rwalk WAH BF BAR. | 


# Exhibit 3.2 
plot (rwalk, type='0',ylab='y') 
abline (modell) 


abline 函数 是 一 个 低级 绘图 函数 ， 如 果 将 一 个 拟 合 好 的 简单 回归 模型 代 人 ， 该 命令 将 会 
在 现 有 的 图 形 上 添加 拟 合 直线 ， 通 过 运行 下 面 的 命令 ， 任 何 形 如 yv-Pt+hz 的 直线 部 可 以 悟 
加 在 图 形 上 : | 
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abline (a=beta0,b=betal) 
例如 ， 以 下 命令 在 当前 图 形 上 添加 了 一 条 45 度 线 . 

abline (a=0,b=1) 

前 已 述 及 lm 函数 可 以 通过 在 波浪 号 右 侧 逐个 设 定 协 变量 或 者 解释 变量 来 拟 合 一 个 多 元 回 
归 模 型 。 协 变量 必须 用 加 号 (+) BRA. 假设 我 们 想 对 rwalk 序列 拟 合 一 个 二 次 时 间 趋 势 模 
型 ， 需 要 创建 一 个 时 间 指 数 平方 的 新 协 变 量 ， 该 二 次 变量 可 以 在 调用 lm 销 数 前 创建 ， 或 者 在 
调用 lm 函数 的 过 程 中 建立 . 对 于 后 面 的 这 种 方法 ， 举 例如 下 : 

modella=lm(rwalk~time (rwalk) +I (time (rwalk) *2) ) 
注意 表达 式 time (rwalk)*2 附 在 工 函数 中 ， 指 示 R 通过 执行 传递 给 I RSET 
变量 .通过 summary 哺 数 来 查阅 拟 合 的 二 次 趋势 模型 . 


> summary (modella) 


Call: 
lm(formula = rwalk ~ time(rwalk) + I (time (rwalk) “2)) 
Residuals: ~ 

Min 10 Median 30 Max 
-2.696232 -0.768018 0.008256 0.853365 2.344685 
Coefficients: 

Estimate Std. Error t value Pr(>|t]) 

(Intercept) -1.4272911 0.4534893 -3.147 0.00262 ** 
time (rwalk) 0.1746746 0.0343028 5.092 4.16e-06 *** 


I (time (rwalk)*2) -0.0006654 0.0005451 -1.221 0.22721 


Signif. codes: 0 '***' 0.001 '**' 0.01 ‘*' 0.05 ‘.’ Oia © OE 
Residual standard error: 1.132 on 57 degrees of freedom 
Multiple R-Squared: 0.8167, Adjusted R-squared: 0.8102 
F-statistic: 127 on 2 and 57 DF, p-value: < 2.2e-16 


summary 函数 重复 了 对 lm 函数 的 调用 . 然后 输出 关于 残 差 的 五 个 汇总 数值 ， 接 下 来 是 参 
数 估 计 值 、 标 准 误差 、t 值 、p 值 列表 ， 所 有 显著 的 协 变 量 都 用 星 号 〈(* ) 标 出 ， 星 号 越 多 意 
味 着 越 显 著 ， 即 更 小 的 p 值 ， 正 如 Signif. codes 那 行 所 解释 的 那样 . 最后， 输出 残 值 的 标 
准 误差 ， 即 估计 的 噪声 项 的 标准 差 以 及 拟 合 模型 的 复 R:， 很 显然 ， 二 次 项 不 显著 ， 因 此 不 需 
要 加 入 模型 ， 从 数据 的 时 间 序 列 图 看 ， 这 也 是 显然 的 . 

读者 也 许 会 疑惑 为 什么 需要 I 函数 . 这 是 因为 没有 工 函 数 ，R 会 应 用 公式 约定 来 解释 
time (rwalk)+ time (zwalk)^2 项 (运行? formula 以 了 解 更 多 公式 的 用 法 )， 因 此 最 终 拟 
合 一 个 线性 趋势 模型 ! 现在 ， 我 们 忽略 R 命令 中 的 1 函数 重新 拟 合 二 次 趋势 模型 ， 比 较 线性 
与 二 次 趋势 模型 的 异同 . 


# Exhibit 3.3 
data (tempdub) 


加 载 tempdub 序列 ， 通 过 运行 ? tempdub 命令 可 以 了 解 更 多 关于 tempdub 数据 集合 的 信息 . 

month.=season (tempdub ) 

表达 式 season (tempdub) 将 会 输出 每 月 的 tempdub 索引 ， 并 将 其 作为 因子 ， 存 人 month. 对 
象 . “对象” 前 的 句号 (. ) 是 名 称 (month. ) 的 一 部 分 ， 包 含 它 将 使 后 续 命 令 的 输出 更 清晰 . 

这 里 先 解释 一 下 何 为 因子 (factor)。 所 谓 因子 就 是 一 种 数据 结构 ， 该 结构 用 以 处 理 定性 
(名 义 ) 数据 ， 这 样 的 数据 不 像 数字 一 样 拥有 自然 顺序 . 然而 ， 出 于 汇总 和 绘图 的 需要 ， 用 户 


RA 门 31] 


可 使 用 levels 参数 来 对 因子 的 值 进行 排序 ， 例 如， 下 面 的 命令 创建 一 个 包含 定性 变量 sex 的 
因子 ， 并 且 以 字母 顺序 作为 默认 顺序 . 


> sex=factor(c('M','F','M','M!,'B!)) 
> 56X 

[1] MFMMPF 

Levels: F M 


我 们 可 以 通过 以 下 方法 改变 排序 : 
> sex=factor(c('M','F','M','M', 'F')},levele=c('M','F')) 
> SEX 


[1] MFMMFEF 
Levels: M F 


注意 这 时 M 和 下 在 levels 中 互 换 了 位 置 ，table MAAK WHE Sl H E HR. 


> table (sex) 
sex M F 
3 2 


输出 按照 level 参数 给 出 的 顺序 列 出 了 数值 的 频数 . 现在 ， 回 到 第 3 章 的 R 脚本 文件 . 

model2=1lm(tempdub-~month.-1) 

前 已 述 及 month 是 一 个 包含 数据 月 份 的 因子 ， 当 公式 中 包含 因子 协 变量 时 ，1lm 图 数 将 会 
用 一 组 与 因子 的 每 个 不 同 水 平 (数值 ) 相对 应 的 示 性 变量 代替 该 因子 变量 .这 里 month 具有 
12 个 不 同 的 水 平 ， Jan，Feb， 等 等 ， 因 此 为 了 代替 month. , 1m 函数 创建 12 个 月 度 示 性 变量 ， 
并 用 这 12 个 示 性 变量 来 代替 month. .由 于 这 12 个 示 性 变量 是 线形 相关 的 (它们 的 和 是 一 个 所 
有 元 素 都 是 1 的 单位 向 量 )， 应 该 去 除 截 距 项 以 避免 多 重 共 线 . 表达 式 中 的 “- 1” 融 是 为 了 处 
理 这 一 问题 . 拟 合 模型 相当 于 对 每 个 月 分 别 拟 合 均值 ， 如果 表 达 式 中 ”- 1 RAM, BA lm 
函数 将 会 通过 忽略 第 一 个 示 性 变量 来 解决 多 重 共 线 问题 ， 即 1 月 的 示 性 变量 将 会 被 删除 ， 在 这 
个 拟 合 模型 中 ， 截 上 距 代表 了 全 部 1 月 的 均值 ， 其 他 月 份 的 系数 代表 了 其 均值 与 1 月 均值 的 
HÆ. 

summary (model2) 

拟 合 回归 模型 的 汇总 通过 这 条 命令 打印 输出 ， 很 多 来 源 于 拟 合 模型 的 变量 也 可 以 轻松 获 
i$. 例如， 拟 合 值 可 以 用 下 面 命令 输出 : 

fitted (model2) 
而 残 差 可 以 通过 下 式 获得 : 

residuals (model2) 


# Exhibit 3.4 

model3=1m(tempdub~month.) # intercept is automatically 
included so one month (anuary) is dropped 

summary (model3) 


# Exhibit 3.5 
har .=harmonic (tempdub, 1) 


第 一 对 调和 函数 (sine 和 cosine 对 ) 可 以 通过 harmonic 函数 建立 ， 该 函数 将 时 间 序 列 作 . 
为 第 一 个 参数 ， 将 谐 波 的 对 数 作 为 第 二 个 参数 ， 运 行 ? harmonic 以 了 解 更 多 相关 信息 ， 调 和 
函数 的 输出 是 一 个 和 矩阵， 保存 在 名 为 nar. 的 对 象 中 ， 再 次 的 第 一 个 句号 是 名 称 的 一 部 分 ， 使 
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得 后 面 的 输出 更 清晰 . 


model4=1m(tempdub-har.) 
summary (model4) 


我 们 现在 简要 讨论 一 下 在 R PRA. ERS ee ea.) AME matrix Á 
数 建立 ， 例 子 如 下 : 


> M=matrix(1:6,ncol=2) 


> M 

[,1] [,2] 
[i] 1 4 
[2,] 2 5 
[3,] 3 6 


matrix 函数 的 第 一 个 参数 是 一 个 向 量 ,使 用 向 量 给 出 的 数值 逐 列 填 人 矩阵， 短 阵 的 列 维 
度 通过 ncol 参数 确定 ， 行 维度 通过 nrow 参数 确定 ， 表 达 式 1:6 表示 疝 量 包含 从 1 到 6 的 整 
数 ， 因 此 matrix 函数 用 六 个 数字 1，2，3，4，5，6 创建 了 一 个 两 列 的 矩阵 .由 于 行 维度 的 
缺失 ，R 假设 矩阵 有 六 个 元 素 ， 因 此 缺失 的 行 维度 被 设 为 2， 和 矩阵 的 维度 可 以 通过 使 用 dim R 
数 获 得 . 

> dim({M) 

[1] 3 2 


显示 了 作为 向 量 的 M 的 行 与 列 维度 . apply 函数 可 以 使 用 给 定 的 函数 逐 列 处 理 矩 阵 ， 例 如 ， 
M 每 一 列 的 均值 可 以 如 下 计算 : 


> apply (M,2,mean) 
[1] 2 5 


apply 函数 的 第 一 个 参数 是 需要 处 理 的 矩阵 ;第 二 个 参数 是 MARGIN， 其 值 为 1 时 表示 对 
行进 行 处 理 ， 为 2 时 表示 对 列 进行 处 理 ; 第 三 个 参数 是 FUN， 为 用 户 定义 的 函数 ， 上 例 指 示 R 
对 M 矩阵 逐 列 处 理 ， 对 每 一 列 使 用 均值 函数 .如 何 修改 R 命令 来 计算 M 矩阵 每 一 行 的 和 呢 ? 


# Exhibit 3.6 

plot (ts (fitted (model4) ,freq=12,start=c(1964,1)), 
ylab='Temperature',type='l1', 
ylim=range {c (fitted (model4) ,tempdub) ) | 

points (tempdub) 


ylim 选项 确保 y 轴 上 有 一 个 区 间 包 含 原始 数据 及 拟人 台数 据 . 
# Exhibit 3.8 
plot (y=rstudent (model3) ,x=as.vector (time (tempdub) ), 
xlab='Time', ylab='Standardized Residuals',type='a') 
表达 式 rstudent (model3) 返回 拟 合 模型 (外 ) 学 生化 残 差 . 如 要 计算 CAD 标准 化 残 
t, 使 用 命令 rstandard (model3). 


# Exhibit 3.11 . 
hist (rstudent (model3) ,xlab='Standardized Residuals') 


hist 函数 对 作为 其 第 一 个 参数 传递 给 它 的 数据 绘制 直方 图 注意 默认 直方 图 标题 是 该 图 
E rstudent (mode13) 的 直方 图 ， 尽 管 默认 的 标题 可 以 正确 描述 所 绘制 内 容 ， 但 是 我 们 经 常 
更 需要 的 是 描述 性 标题 而 非 技 术 性 标题 ， 例 如 ， 可 以 设置 选项 main= 'Histogram of the 


Standardized Residuals". 
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# Exhibit 3.12 
qqnorm (rstudent (model3)) 


表达 式 rstudent (mode13) 提 取 了 model3 的 标准 残 差 . 而 qqnorm A% e H SCREW 
QQE 态 得 分 图 ， 并 且 辅 助 直线 可 以 通过 命令 qqline (rstudent (model3)) MANZE QQ IEA 
得 分 图 中 、 


# Exhibit 3.13 
acf (rstudent (model3) ) 


acf MMi SHAK RAH PIMA RRR. 最 大 滞后 长 度 根据 样本 容量 大 小 
自动 确定 ， 但 是 在 调用 函数 时 ， 也 可 以 通过 设 定 选项 max. 1ag= 30， 把 滞后 长 度 修 改 为 30. 
Shapiro-Wilk 检验 和 游程 检验 可 以 通过 以 下 命令 进行 : 


shapiro.test (rstudent (mode13) ) 
runs (rstudent (model3)) 


这 些 命令 可 以 计算 统计 量 的 值 及 其 相应 的 p 值 . 
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# Exhibit 4.2. 
data (mal .2.8s) 
plot (mal.2.s,ylab=expression(Y[t]),type='o') 


R 软件 可 以 在 图 形 中 显示 数学 符号 ， 选 项 ylab= expression (y[tl) 484A y 轴 标 签 是 以 :* 
为 下 标的 Y， 都 采用 数学 字体 . 公式 排版 的 确 需要 一 些 额 外 的 工作 .查阅 legend(? legend) 
的 帮助 文件 并 且 运 行 命令 demo (mathplot) 了 解 更 多 相关 信息 . 

模拟 长 度 n 王 100 HRA MAHER O =—0. 9 的 MA(1) 序列 可 以 通过 以 下 命令 来 实现 ; 

set .seed (12345) 

该 命令 初始 化 随机 数 生 成 器 的 种 子 ， 因 此 在 需要 时 ， 模 拟 过 程 是 可 复制 的 ， 没有 这 一 命 
令 ， 随 机 数 牛 成 生 器 将 会 “随机 ”初始 化 ， 无 法 复制 模拟 结果 . 此外， 参数 12345 可 以 用 其 
他 数字 代替 来 获得 不 同 的 随机 数 . 

y=arima.sim(model=list (ma=-c(-0.9)),n=100) 

arima. sim 函数 模拟 的 时 间 序 列 是 将 某 给 定 ARIMA 模型 作为 包含 AR 和 MA 参数 向 量 
的 列表 代入 函数 得 到 的 ， 以 上 模拟 的 是 MA(1) 模型 ， 其 列表 中 没有 AR 部 分 ，R 软件 在 参数 
化 MA 部 分 时 使 用 了 加 号 的 表示 习惯 ， 因 此 在 MA 参数 向 量 前 加 减 号 来 符合 我 们 的 参数 表示 
方式 ， 样 本 容量 是 由 参数 n 确定 . 因此， 以 上 命令 指示 R 使 用 外 二 一 0.9 的 MAC) 模型 模拟 
长 度 是 100 的 一 个 实现 . 

我 们 现在 偏离 主题 ， 来 讨论 一 下 与 list 相关 的 内 容 . 列表 在 R 中 是 最 灵活 的 数据 结构 . 
可 以 将 列表 想象 为 一 个 拥有 很 多 抽 居 (元 素 或 成 分 ) 的 柜子 ， 每 一 个 抽 展 都 可 能 包含 不 同 结构 
的 数据 ， 例 如 ， 列 表 的 某 个 元 素 可 以 是 另 一 个 列表 ! 列表 中 的 元 素 根据 它们 所 输入 的 顺序 进行 
排序 ， 此外， 可 以 对 列表 的 元 素 进 行 命名 以 方便 检索 ， 列 表 通 过 把 元 素 作 为 参数 用 list HR 
来 创建 ， 相 应 元 素 按照 和 名称 王 数值 (name= value) 并 以 逗号 隔 开 的 方式 传递 给 list 函数 . 
下 面 的 例子 是 一 个 包含 名 为 a,b, c 三 个 元 素 的 列表 ， 其 中 a 是 一 个 三 维 向量 ，b 是 一 个 数字 ， 
c 是 一 个 时 间 序 列 . 
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> listl=list (a=c(1,2,3),b=4,c=ts(c(5,6,7,8), 
start=c(2006,2),frequency=4) ) 


> listl 
Sa 
[1] 1 2 3 
b 
[1] 4 
SC Qtr1 Qtr2 Qtr3 Otr4 
2006 5 6 7 
2007 8 
为 了 检索 列表 中 的 元 素 ， 运 行 命 令 listname$ elementname. 例如 

> listisc 

Qtr1 Qtr2 Qtr3 Qtr4 
2006 5 6 7 
2007 8 


不 规则 结构 的 数据 可 以 作为 列表 保存 ， 函 数 的 输出 经 常 是 一 个 列表 .如 果 需 要 打印 的 列表 比较 
大 ， 那 么 仅仅 输入 列表 名 称 可 能 会 产生 令 人 眼花 红 乱 的 输出 。 另 一 种 方案 是 使 用 str 函数 
(str 代表 structure) 探索 列表 的 结构 .例子 如 下 : 


> str(listl) 
List of 3 
$ a: num (1:3] 1 2 3 
S$ b: num 4 
$ c: Time-Series [1:4] from 2006 to 2007: 567 8 


以 上 内 容 显示 list 包含 三 个 元 素 ， 并 且 对 元 素 进行 了 简单 的 描述 . 
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# Exhibit 5.4 
plot (diff (log(oil.price)),ylab='Change in Log(Price)', 
type='1') 


diff 函数 输出 给 定时 间 序 列 的 一 阶 差分 ， 更 高 阶 的 差分 可 以 通过 提供 differences B 
数 来 计算 .例如 ，log (oil. price) 的 二 阶 差 分 可 以 通过 以 下 命令 进行 计算 : 

diff(log(oil.price), differences=2) 

R 中 一 个 有 用 的 惯例 是 只 要 其 不 引起 歧义 ， 函 数 中 的 参数 就 可 以 缩写 ， 例 如 之 前 的 命令 可 
以 被 缩写 为 

diff (log(oil.price) ,diff=2) 
注意 diff 函数 的 第 二 个 参数 是 滞后 参数 .通过 默认 值 lag= 1 和 diff 函数 可 以 计算 普通 差 
分 一 一 一 阶 或 更 高 阶 差 分 ， 后 面 ， 我 们 在 考虑 季节 性 时 间 序 列 数据 时 ， 有 时 需要 考虑 季节 差 
分 ， 例 如 ， 我 们 希望 从 一 年 以 前 的 相同 月 份 中 减 去 该 月 份 数字 ; 也 就 是 说 ， 计算 具有 12 个 月 
灌 后 的 差分 .这 一 过 程 可 以 通过 设 定 lag= 12 完成 ， 作 为 演示 ， 可 以 通过 命令 diff (temp - 
dub, 1ag= 12) 来 计算 周期 是 12 的 季节 差分 .那么 命令 diff (log (oil. price),2) 将 会 得 出 
什么 结果 呢 ? 当 作者 之 一 (KSC) 试 着 运行 类 似 的 带 有 未 命名 参数 的 命令 来 计算 某 些 时 间 序 列 
的 二 阶 差分 时 ， 不 只 一 次 地 犯 了 严重 的 错误 ， 带 有 未 命名 参数 时 ， 实际 上 计算 出 的 结果 是 2 阶 
滞后 的 季节 差分 ， 并 不 是 2 阶 差 分 ! 可 以 想见 在 那些 焦虑 的 小 时 中 ， 他 所 有 的 挫折 感 丝 源 自 蚀 
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误 计 算 所 得 的 数据 分 析 ， 严 重 背 离 了 基于 理论 的 预期 . 我们 得 到 的 教训 就 是 ， 除 非 完全 了 解 相 
关 参 数 的 位 置 ， 否 则 使 用 未 命名 参数 是 非常 危险 的 .最 好 记 住 ， 未 命名 参数 如 果 出 现 的 话 ， 应 
该 出 现在 参数 列表 的 开始 ， 并 且 在 命名 参数 后 不 应 该 再 出 现 未 命名 参数 . 事实 上 ,混合 参数 
(命名 参数 与 未 命名 参数 杂乱 无 章 地 进行 排列 ) 可 能 会 导致 R 的 错误 编译 ， 郴 数 中 的 参数 顺序 
可 以 通过 运行 args (function. name) 或 ? function. name 命令 进行 快速 查看 ， 此 处 func- 
tion. name 应 被 希望 查看 的 函数 名 代替 . 


# Exhibit 5.11. 
library (MASS) 


该 命令 加 载 MASS fF. 运行 命令 library (help= MASS) 查 看 该 库 的 内 容 . 

boxcox (lm(electricity~1)) 

boxcox 函数 计算 对 应 变量 寡 变 换 后 适合 数据 的 线性 回归 模型 的 极 大 似 然 估计 ， 第 一 个 参 
数 是 通过 lm 函数 所 确定 的 拟 合 模型 . 在 默认 条 件 下 ，boxcox AROK S E M eS BY Mt BA 
oR KR. FEB BY MLE 是 使 似 然 曲线 达到 最 大 值 时 的 数值 .此 处 设 定 的 模型 是 经 过 某 个 生 
变换 的 electricity 用 常数 加 上 白 品 声 来 拟 合 的 . 但 是 ， 我 们 已 经 知道 electricity 是 序 
列 相 关 的 ， 因 此 由 于 序列 的 自 相 关 问 题 没 能 被 考虑 ， 这 种 方法 并 非 完 全 正确 . 

对 于 时 间 序 列 分 析 而 言 ， 更 加 合适 的 模型 是 睾 变 换 后 的 时 间 序 列 变量 服从 AR 模型 . RR 
BoxCox. ar 可 以 实现 这 个 模型 ， 但 它 也 有 两 个 缺陷 ,一 是 占用 过 多 的 计算 资源 ， 二 是 当前 版 
本 的 函数 中 模型 无 法 包含 其 他 的 协 变 量 ，BoxCox. ar 函数 的 第 一 个 参数 是 时 间 序 列 变 量 的 名 
称 ，AR 的 阶 数 可 以 由 用 户 通 过 order 参数 设 定 . 如 果 AR 的 阶 缺 失 ， 那 么 函数 将 会 通过 对 对 
数 变换 后 数据 最 小 化 AIC 来 估计 AR 的 阶 . boxcox 和 BoxCox. ar 函数 都 要 求 应 变量 为 正 数 . 

BoxCox.ar (electricity) 


该 命令 用 以 绘制 考虑 到 数据 自 相关 性 的 模型 中 宪 参数 的 对 数 似 然 函数 图 . 
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# Exhibit 6.9 

acf (ma2.s,ci.type='ma',xaxp=c(0,20,10)) 

参数 ci. type= 'ma ' 指 示 R 绘制 带 置 信 区 间 的 样本 ACK. HOR Brida ACF 的 置信 区 间 基 
于 MA(k 一 1) 模型 的 假设 计算 得 到 ， 可 参阅 方程 (6. 1. 11) 查看 细节 . 


# Exhibit 6.11 
pacf (arl.s,xaxp=c(0,20,10)) 


该 命令 计算 和 绘制 样本 PACF 函数 . 运行 命令 ? par 了 解 更 多 关于 xaxp 参数 的 信息 . 


# Exhibit 6.17 
eacf (armall.s) 


该 命令 计算 数据 armall. s 的 样本 EACF 函数 (扩展 自 相 关 函 数 ). AR 和 MA 的 最 大 阶 数 
可 以 通过 ar. max 和 ma. max 参数 设 定 . 它们 的 默认 值 分 别 是 7 和 13， 例如，eacf (ar- 
mall. s,ar. max= 10,ma. max= 10) 表 示 以 AR 和 MA 的 最 大 阶 为 10 来 计算 EACF eh BR. 
EACF 函数 将 会 打印 出 一 张 符 号 表格 ， 其 中 X 代表 显著 的 数值 ，O 代表 非 显 著 的 数值 . 


library (uroot) 
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该 命令 加 载 uroot 库 ， 接 下 来 的 命令 演示 了 Dickey-Fuller 单位 根 检验 的 计算 . 
ar (diff (rwalk)) 


该 命令 求 出 差分 后 序列 的 AR 阶 数 ， 根 据 最 小 AIC 准则 ， 确 定 阶 数 为 8. 


ADF .test (rwalk, selectlags=list (mode=c(1,2,3,4,5,6,7,8), 
Pmax=8) ,itsd=c(1,0,0))} 


该 命令 对 数据 rwalk 进行 ADF 检验 .参数 selectlags 取 值 为 基 列 表 . BR mode RE 
融 要 包括 的 涡 后 长 度 ， 如 果 该 参数 缺失 ， 参 数 Pmax HARAR RE, ADF. test 国 数 通过 
将 模式 设 为 signif,aic 或 者 bic 等 多 种 方法 确定 检验 中 的 滞后 长 度 . 选项 signif 是 mode 
的 默认 值 ， 只 保留 显著 的 滞后 项 估计 AR 模型 的 子 集 . 参数 itsd 要 求 为 向 量 ， 前 两 个 元 素 为 
-元 变量 ， 表 明 是 否 包 含 常数 项 (如 果 第 一 个 元 素 为 1) 或 线形 时 间 趋 势 〈 如 果 第 二 个 元 素 为 
1); 如 果 模 型 中 不 包含 其 他 协 变 量 ， 那 么 第 三 个 元 素 为 0， 查看 ADF. test 的 帮助 页 ， 可 以 了 
解 更 多 的 信息 ， 因 此 ，R 命令 指示 ADF. test 函数 进行 零 假设 检验 ,和 零 假设 是 模型 有 单位 根 和 
截 距 项 ， 备 择 假设 是 模型 平稳 ， 较 小 的 证 值 意 味 着 平稳 ! 

ADF .test (rwalk, selectlags=list (Pmax=0) ,itsd=c(1,0,0)) 

比较 一 下 我 们 可 以 发 现 ， 上 面 的 命令 进行 ADF 检验 ， 零 假设 是 模型 具有 单位 根 和 截 距 项 ， 
但 不 存在 其 他 滞后 项 ， 但 是 备 择 假 设 设 定 模型 为 具有 和 截 距 项 的 平稳 ARC) 模型 .如 果 参 数 
itsd= c (0,0,0)， 那 么 备 择 模 型 是 中 心 化 的 平稳 ARG) 模型 ， 即 具有 零 均 值 ， 这 样 的 假设 
并 不 恰当 ， 除 非 数据 已 经 进行 了 均值 修正 . 


# Exhibit 6.22 

set .seed (92397) 

test=arima.sim(model=list (ar=c (rep(0,11), .8), 
ma=c(rep(0,i11),0.7)),n=120) 


该 命令 模拟 了 ARMA 模型 子 集 ， 这 里 rep (0,11) 表 示 11 +S. 
res=armasubsets (y=test,nar=14,nma=-14,y.name='test', 
ar.method='ols') 


armasubsets 函数 计算 各 种 子 集 的 ARMA 模型 ，nar 和 nma 参数 确定 AR 和 MA 的 最 
大 阶 数 ， 在 上 例 中 两 个 阶 数 的 最 大 值 均 为 14. 用 缺 省 ols 方法 〔〈 普 通 最 小 二 乘法 ) 估计 相应 
AR 模型 . 

plot (res) 

plot 函数 是 一 个 巧妙 的 函数 ， 鉴 于 res 是 armasubsets 函数 的 输出 ， 该 郴 数 绘制 一 个 
表格 ， 可 以 显示 ARMA 模型 的 几 个 最 优 子 集 . 
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下 面 的 函数 计算 MAC) 模型 中 MA(1) 系数 的 矩 估 计量 . 这 是 一 个 简单 的 R 函数 的 例 
子 ， 只 需 把 它 复制 并 粘贴 到 R 的 控制 台 窗 口 ， 按 回 车 键 编译 代码 ， 就 可 以 创建 esti- 
mate. mal. mom 函数 ， 并 且 在 工作 区 中 使 用 . 这 一 函数 仅仅 存在 于 它 所 创建 的 特定 工作 
区 中. 

estimate.mal.mom=function (x) {r=acf (x,plot=F)$acf [1] ; 


if (abs(r)<0.5) return( (-l+sqrt (1-4*r%2))/(2*r)) 
else return(NA) } 
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对 于 R 编程 不 感 兴趣 的 读者 可 以 跳 过 以 下 内 容 ， 直 接 到 关于 图 表 7-1 的 部 分 ，R 函数 的 语 
法 采用 以 下 形式 : 

function.name = function(argument list) {function body} 
其 中 function body 是 一 组 R 语句 〈 命 令 )， 一 般 来 说 ， 完 整 的 R 命令 通过 换行 隔 开 ， 此 外 ， 
它们 也 可 以 用 分 号 符号 〈“;) 隔 开 . 如 果 及 命令 不 完整 ， 那 么 人 将 假设 该 命令 在 下 行 继续 ， 以 
此 类 推 ， 直 到 R 读 到 完整 的 命令 ， 所 以 以 上 函数 包含 一 个 名 为 x 的 参量 并 包含 两 条 命令 ， 第 
一 个 命令 是 

r=acf (x, plot=F) $acf [1] 
指示 R 计算 x 的 acf 但 是 不 用 画图 ， 提 取 计 算 的 样本 自 相 关 函 数 的 首 个 元 素 ( 即 1 HAA 
相关 系数 )， 将 其 保存 在 名 为 工 的 对 象 中 对象 上 是 一 个 局 部 对 象 ， 仅 在 在 于 esti- 
mate. mal. mom 罗 数 环 十 中 .第 二 个 命令 为 


if (abs(r)<0.5) 
return ( (-l+sqrt (1-4*r°2))/(2*r)) else return (NA) 


注意 if 从句 与 命令 后 半 部 分 之 间 的 换行 . 因为 单单 是 if 从 句 是 不 完整 的 ，R 假设 在 下 一 行 该 
命令 会 继续 ， 在 第 二 行 ，R 发 现 了 完整 的 尺 命 令 ， 因此 推断 两 行 命令 一 起 是 一 条 完整 的 命令 ， 
换血 话说 ，R 把 下 一 个 命令 等 价 于 下 面 一 行 命令 : 

if (abs(r)<0.5) return( (-l+sqrt (1-4*r*2))/(2*r)) else return (NA) 
abs 函数 用 以 计算 参数 所 赋值 的 绝对 值 ， 而 sqrt 是 计算 参数 的 平方 根 函 数 . 现在 ， 我 们 已 经 
准备 好 来 解释 第 二 条 命令 了 : WR 的 绝对 值 ， 即 x 的 1 阶 滞后 自 相 关 数 值 小 于 0.,5， 函 数 返 
回 数字 

(— 1 + sqart(1— 4# r2))/ 2 7 

它 是 MA(1) 系 数 6 的 距 估 计量 ; 否则 函数 返回 NA( 参 阅 方程 (7.1.4). AS NA 在 R PRR 
缺失 值 . (NR 表示 not available.) AP PRG REBA PAE. Ail, RUHR 
数 返 回 函 数 体 中 最 后 一 个 命令 产生 的 数值 ，R 提供 了 用 于 进行 统计 的 强大 的 计算 机 语言 ， 可 以 
参阅 R 网 站 中 的 文件 ， 了 解 更 多 R 编程 的 信息 . 


# Exhibit 7.1 
data (mal.2.s) 


该 命令 加 载 一 个 模拟 的 MA(1) 序列 . 

estimate.mal.mom(mal.2.s) 

该 命令 是 使 用 上 面 用 户 创 建 的 estime. mal. mom mM. AAT MAC) 的 系数 . 

data (arl.s) 

该 命令 从 TSA 包 中 加 载 模拟 的 ARC) 序列 . 

ar(arl.s,order.max=1,AIC=F,method='yw' ) 

该 命令 计算 对 aril. s 序列 估计 的 AR 的 系数 . ar RR POR AR 模型 〈 即 均 
值 修正 后 的 数据 )}， 因 此 截 距 一 定 为 零 且 不 被 估计 或 者 不 在 输出 中 显示 . ar 函数 要 求 用 户 通 过 
order. max 参数 设 定 最 大 的 AR 阶 数 . AR 的 阶 数 可 通过 在 0 和 最 大 阶 数 之 间 选 择 使 最 小 AIC 
模型 的 阶 来 估计 ， 这 一 选项 可 以 通过 令 AIC 参数 为 真 ， 即 AIC= TREE. 或 者 可 以 通过 设 定 
AIC= F 来 转换 阶 数 的 选择 ， 后 一 种 情况 下 ，AR 的 阶 被 设 定 等 于 最 大 AR 阶 数 . ar 函数 可 以 
使 用 多 种 方法 估计 AR 模型 ， 包 括 求 解 Yule-Walker 方程 、 普 通 最 小 二 乘法 、 极 大 似 然 估计 法 
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(假设 正 态 分 布 的 日 噪声 误差 项 )， 这 些 方法 分 别 对 应 着 选项 method= 'yw'.method= 'ols' 或 
method= 'mle’. 特别 地 ， 上 面 的 民 命 令 对 ari. s 序列 通过 求解 Yule-Walker 方程 拟 合 AR(1) 
模型 . 

我 们 暂 离 主 题 ， 简 单 讨 论 一 下 取 值 为 真 (TRUE) 或 假 (FALSE) 的 逻辑 变量 的 概念 . 
这 些 值 可 以 被 缩写 为 了 和 F. EZH HARAP, TEHER FAO 表示， 关于 逻辑 变量 ， 
R 采用 了 非常 有 用 的 惯例 ， 如果 出 现在 数学 表达 式 中 的 逻辑 变量 值 为 人 下， 则 自动 转化 为 1， 否 
则 为 0. 

# Exhibit 7.6 


data (armall.s) 
arima(armall.s, order=c({1,0,1),method='CsSs'} 


arima 畏 数 对 作为 第 一 个 参数 代 和 人 的 时 间 序 列 估 计 ARIMACp. d, q) fA. ARIMA 的 
阶 用 order 参数 order= ctp,d,9) 来 确定 ， 因 此 ， 以 上 命令 对 数据 拟 合 ARMA(1，1) 模型 . 
估计 可 以 使 用 条 件 平 方 和 法 (method= 'css') RA AW BBY (method= 'ML') 来 完成 
默认 的 估计 方法 是 极 大 似 然 估计 法 ， 初 始 数值 通过 CSS 法 确定 ，arima 晒 数 打印 出 拟 合 模型 
的 汇总 ， 拟 合 模型 也 可 以 被 保存 为 一 个 对 象 以 便 进一步 应 用 ， 例 如 模型 诊断 ， 默 认 设置 中 ， 如 
果 d= 二 0， 那么 将 会 拟 合 平稳 ARMA 模型 . 同样 ， 拟 合 模型 采用 中 心 化 模式 ， 即 对 减 去 样本 均 
值 后 的 序列 拟 合 ARMA 函数 . arima 函数 输出 中 报告 的 截 距 项 是 一 个 误 称 ， 因 为 它 实 际 上 是 
均值 ! 但 是 ， 这 样 估 计 出 来 的 均值 一 般 来 说 与 样本 均值 稍 有 不 同 . 


# Exhibit 7.10 
res=arima (sqrt (hare) ,order=c(3,0,0)) 


该 命令 将 拟 合 的 ARG) 模型 保存 在 名 为 res 的 对 象 中 ，arima AA IA list. 32 
行 命令 str (res) 可 以 查看 保存 在 res 中 的 内 容 ， 你 会 发 现 保存 在 res 中 的 大 部 分 内 容 无 法 直 
接应 用 ， HE. arima 函数 的 输出 必须 用 其 他 命令 来 处 理 以 便 概括 更 多 信息 ， 例 如 ， 拟 合 模型 
的 (原始 ) 残 差 可 以 通过 residuals MAMA residuals (res) 命 令 来 计算 . 拟 合 值 可 以 通过 
运行 fitted (res) 获 得 . 下 面 讨 论 其 他 有 用 的 函数 ， 用 以 处 理由 arima 肾 数 得 到 的 拟 谷 ARI- 
MA 模型 . 

下 面 演示 使 用 自助 法 进行 统计 椎 断 的 实证 方法 ， 

set.seed (12345) 

该 命令 初始 化 随机 数 生 成 器 的 种 子 ， 因 此 模拟 研究 可 以 被 重复 . 


coefm.cond.norm=arima.boot (res, cond.boot=T,is.normalsT, 
B=1000, init=sqrt (hare) ) 


arima. boot KRET HAH ARIMA 模型 展开 自助 分 析 . 第 一 个 参数 是 拟 合 的 ARIMA 
模型 ， 即 arima 函数 的 输出 .有 四 个 不 同 的 自助 法 可 以 使 用 : 自助 序列 可 以 用 提供 的 数值 初始 
化 (cond. boot= 7T) 或 者 不 提供 初始 化 数值 (cond boot= F)， 可 用 使 用 非 参 自助 (is. normal= F) 
或 者 假设 正 态 新 息 的 参数 自助 (is. normal= T). 对 于 条 件 自助 ， 初 始 数值 可 以 以 向 量 方式 提 
{t (arima. boot 函数 将 会 使 用 提供 的 向 量 中 的 数值 作为 初始 值 )， 自 助 样本 容量 ， 比 如 1000, 
可 以 通过 选项 B= 1000 来 设 定 ，arima. boot 函数 输出 一 个 矩阵 ， 该 矩阵 的 每 一 行 都 是 对 目 助 
数据 使用 极 大 似 然 估计 法 所 得 到 的 ARIMA 系数 的 自助 估计 值 . 因此 ， 如 果 B= 1000 并 且 模 
型 为 AR(3)， 那 么 输出 是 一 个 1000 乘 以 4 的 矩阵 ， 该 矩阵 的 每 一 行 按照 o bre Br D 的 


RAN 319 


顺序 由 自助 ARQ), AR(2) 和 AR(3) 系数 加 上 均值 估计 值 组 成 . 


signif (apply (coefm.cond.norm, 2, function (x) 
{quantile (x,c(.025,.975),na.rm=T) }) ,3) 


这 是 一 个 复合 人 语句， 等 同 于 两 条 命令 : 
temp=apply (coefm.cond.norm, 2, function (x) 

{quantile (x,c(.025,.975),na.rme=T) }) 
signif (temp, 3) 


只 有 临时 变量 tem 未 在 原来 的 复合 语句 中 创建 ， 回忆 一 下 apply ARE — Aik EAE ey H pR 
数 ， 这 里 apply 画 数 逐 列 处 理 coefm cond. norm 矩阵， 每 一 列 都 提供 纵 用 户 提供 的 未 命名 了 销 数 . 

function (x) {quantile (x,c(.025,.975),na.rm=T) } 

这 一 未 命名 函数 只 有 一 个 输入 ， 称 为 x， 该 输入 用 quantile 函数 外 理 ，quantile 函数 读 取 
向 量 并 且 计 算 与 第 二 个 参数 设 定 的 概率 对 应 的 样本 分 位 数 ， 第 三 个 参数 设置 是 na. rm= Tina 代表 
不 可 获得 ，rm 代表 去 掉 )， 意 味 着 在 计算 分 位 数 前 去 掉 输 入 中 的 任何 缺失 值 . 这 一 规范 非常 重 
要 ， 因 为 在 R P., 默认 设置 为 任何 具有 缺失 数值 的 数据 集 的 分 位 数 被 定义 为 缺失 值 (NA). 
( 某 些 自助 序列 在 拟 合 ARIMA 时 存在 收敛 问题 ， 因 此 自助 函数 的 输出 可 能 包含 一 些 缺 失 值 ). 
现在 回 过 来 解释 右 侧 的 temp 命令 ， 该 部 分 指示 R 计算 每 个 自助 系数 估计 量 的 第 2.5 百 分 位 数 
和 第 97. 5 百 分 位 数 ， 为 了 能 够 精确 计算 ，R 对 象 中 的 数字 会 保留 很 高 的 有 效 数字 位 数 . 但 是 ， 
打印 版 本 中 ， 为 了 看 起 来 清楚 ， 只 保留 比较 少 的 有 效 数字 位 数 . 这 可 以 通过 signif MMs 
成 ，signif 函数 输出 作为 第 一 个 参数 代入 的 对 象 ， 但 仅仅 显示 第 二 个 参数 设 定 的 有 效 数字 的 
位 数 ， 在 这 个 例子 中 是 3， 整 个 复合 R 命令 计算 了 每 个 AR 系数 95% 自 助 置信 和 区间. 
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# Exhibit 8.2 

data (hare) 

ml .hare=arima (sqrt (hare) ,order=c(3,0,0)) 
ml .hare 


该 命令 打印 出 经 过 开 方 变换 的 hare 数据 的 拟 合 ARG) MAY. 结果 证 明 ARCO) 系数 佑 计 
Ri AGH. 注意 AR(2) 系数 在 系数 向 量 中 是 第 二 个 元 素 ， 正 如 拟 合 模型 输出 所 示 . RE 
素 固 定 为 某 一 特定 值 的 有 约束 的 ARIMA 模型 可 以 通过 使 用 arima 函数 的 fixed 参数 来 拟 合 . 
参数 fixed 应 该 是 一 个 与 系数 向 量 长 度 相同 的 向 量 ， 该 向 量 中 所 有 自由 元 素 设 定 为 Na， 所 有 
约束 参数 设 定 为 0 (或 者 其 他 固定 值 )， 例 如 ， 此 处 AR(2) 系数 限制 为 0( 上 三 0)， 因 此 fixed= 
c(NA,0,NA,NA), ， 即 ARGO), ARG) 以 及 “ 截 距 项 ”为 自由 参数 ， 而 ARO 固定 为 0。 记 住 
“ 截 距 项 ”排列 在 最 后 .下 面 的 命令 对 野兔 数据 拟 合 有 约束 的 AR(3) 模型 . 

m2.hare=arima (sqrt (hare) ,order=c(3,0,0), 


fixed=c (NA, 0, NA, NA) } 
m2.hare 


需要 注意 的 是 在 中 心 化 形式 的 ARMA 模型 中 截 距 项 实际 上 是 均值 . 即 如 果 y 一 sqrt(bhare) 一 
intercept， 则 模型 为 
y, = 0. 919y,1 — 0.5313y,s te: 
因此 , “真正 ”的 估计 的 截 距 等 于 5. 6889X(—0.919+0.5313)=3. 483， 正 如 书 中 所 述 . 
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plot (rstandard (m2 .harel ， 
ylab='Standardized Residuals',type='b') 


rstandard 畏 数 用 于 计算 标准 残 差 ， 即 原始 残 差 用 估计 的 噪声 标准 误差 标准 化 . 

abline (h=0) 
增加 一 条 y 轴 的 截 上 中 为 零 的 水 平 直线 .使 用 及 的 帮助 查找 如 何 添 加 一 条 z FHKE = 10 YE 
AR. 


# Exhibit 8.12 (WExhibit 8.1 中 的 某 些 命令 作为 开始 } 
data (color) 

ml .color=arima (color, order=c(1,0,0)) 
tsdiag(mi.color,gof=15,omit.initial=F) 


在 TSA 包 中 的 tsdiag 函数 是 对 尺 的 stats 包 中 的 函数 修改 得 到 的 ， 主 要 是 对 拟 合 模型 
进行 模型 诊断 ， 参 数 gof 设 定 在 模型 诊断 中 使 用 的 acf 函数 的 最 大 滞后 长 度 ， 设 参数 o- 
mit. initial= T, 分析 时 可 以 忽略 最 初 的 几 个 残 差 .这 一 选项 对 检验 季节 模型 特别 有 用 ， 由 
于 构建 的 原因 季节 模型 最 初 的 几 个 残 差 接近 于 0， 包含 这 些 残 差 可 能 会 使 模型 诊断 产生 偏差 ， 
在 这 个 例子 中 参数 omit. initial 被 设 为 fF， 因此 诊断 将 基于 全 部 残 差 进行 。 回忆 一 下 Ljung- 
Box QEG) 检验 统计 量 等 于 残 差 1 阶 沾 后 到 Kk 阶 滞 后 自 相 关系 数 的 平方 和 ， 见 方程 
(8. 1. 12)， 假 设 ARIMA 模型 的 阶 被 正确 设 定 ， 为 了 保证 Ljung-Box 检验 统计 量 的 近似 卡 方 分 
布 有 效 ， 要 求 K 值 应 该 大 于 某 滞后 长 度 ， 大 于 该 滞后 时 ， 原 始 时 间 序 列 的 目 相关 系数 可 以 忽略 
Kit. Æ TSA 包 中 修改 后 的 tsdiag 函数 会 检测 这 一 条 件 ， 因 此 Liung-Box 检验 只 对 充分 大 
的 计算， 如 果 所 需要 的 值 大 于 指定 的 最 大 滞后 ，tsdiag 将 会 返回 错误 信息 ， 该 问题 可 以 
通过 增加 所 要 求 的 最 大 滞后 阶 数 来 解决 ， 使 用 ? tsdiag 命令 可 以 了 解 更 多 关于 tsdiag A% 
的 信息 . 
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# Exhibit 9.2 

data (tempdub) 
tempdubl=ts (c(tempdub, rep(NA,24)),start=start (tempdub), 
freq=frequency (tempdub) ) 


该 命令 向 tempdub 数据 添加 了 两 年 的 缺失 数值 ， 因 为 我 们 希望 预测 未 来 两 年 的 气温 . 
start 函数 提取 时 间 序 列 的 开始 日 期 . frequency 函数 提取 被 代 人 时 间 序 列 的 频率 ， 此 处 为 
12， 因 此 tempdubl 包含 增加 了 两 年 缺失 数据 的 Dubuque 的 气温 序列 ， 具 有 相同 的 开始 日 期 
以 及 单位 时 间 间 隔 上 相同 的 抽样 频率 . 

har.=harmonic (tempdub, 1) 

该 命令 创建 了 第 一 对 调和 函数 . 

m5.tempdub=arima (tempdub, order=c(0,0,0),xreg=har. ) 

该 命令 用 arima 函数 拟 合 调 和 回归 模型 协 变量 通过 参数 xreg KAR. 在 这 个 例子 
th, har. 是 协 变量 ， 并 且 arima 函数 用 应 变量 对 协 变量 拟 合 了 一 个 线性 回归 模型 ， 假 设 误 老 
项 服从 ARIMA 模型 ， 因为 ARIMA 的 阶 设 为 =d = 一 9 一 0， 假 设 的 误差 结构 为 白 噪 声 ; 即 
arima 函数 用 tempdub 对 第 一 对 调和 函数 拟 合 了 一 个 普通 的 线性 回归 模型 ,注意 这 一 结果 与 
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使 用 lm 函数 拟 合 的 结果 相同 ， 以 下 命令 可 以 证 实 这 一 结论 : 
har.=harmonic(tempdub,1); model4=lm(tempdub~har. ) 
summary (model4) 


参数 xreg 期 望 协 变量 的 输入 或 者 是 一 个 矩阵 或 者 是 data. fame. A] LE data. frame 看 
做 是 这 样 一 个 矩阵 ， 该 矩阵 由 几 个 协 变 量 捆绑 在 一 起 逐 列 排 列 构成 ， 具 有 多 个 参数 的 da- 
ta. frame 函数 可 用 创建 这 一 算 阵 ， 每 个 参数 都 采取 covariate. name= R statement 的 方式 
计算 协 变 量 ， 如 果 covariate. name KAM, R statement 将 会 成 为 变量 名 称 ， 这 对 于 一 个 
复杂 的 定义 语句 来 讲 是 不 台 适 的 ， 如果 R statement 是 一 个 符 阵 ， 那 么 该 矩阵 的 每 一 列 都 被 
作为 协 变量 ， 每 列 的 名 称 作为 协 变量 的 名 称 . 考虑 一 个 例子 : 通过 增加 线性 时 间 趋 势 扩 展 上 面 
的 调和 回归 模型 ， 扩展 模 型 可 以 通过 下 面 的 命令 来 拟 合 ; 


arima(tempdub, order=c (0,0,0), 
xreg=data. frame (har. ,trend=time (tempdub) )) 


m5 .tempdub 
该 命令 打印 出 拟 合 模型 . 

我 们 现在 用 一 个 例子 来 说 明 珊 测 . 

newhar.=harmonic(ts(rep(1,24), start=c(1976,1),freq=12) ,1) 

该 命令 创建 一 个 从 1976 年 1 月 开始 跨越 两 年 的 调和 函数 .记得 tempdub 序列 的 终止 时 间 
是 1975 年 12 月 . 


plot (m5.tempdub,n.ahead=24,n1l=c (1972,1) ,newxreg=newhar., 
col='red', type='b’,ylab='Temperature',xlab='Year') 


该 命令 基于 作为 第 一 个 参数 赋予 的 拟 合 模型 计算 并 绘制 预测 值 . 此 处 ， 我 们 通过 参数 
n. ahead= 24 设 定 24 步 向 前 预测 ， 预 测 期 的 协 变量 值 需要 通过 newxreg BREE. 参数 ne- 
wxreg 应 该 与 参数 xreg 在 协 变量 各 个 方面 相 匹 配 ， 除 了 数值 来 自 不 同 的 时 期 ， 通 过 使 用 参数 
n1， 图 形 的 开始 日 期 可 以 与 时 间 序 列 的 开始 日 期 不 同 ， 此 处 ，nl= c(1972,1) BE 1972 年 1 
月 为 图 形 的 开始 日 期 对 于 非 季 节 性 数据 〈 即 频率 王 1)，nl 应 该 是 标量 .参数 col MM type 


代表 所 绘 线段 的 颜色 和 形状 . 


# Exhibit 9.3 

data (color) 

ml.color=arima (color, order=c(1,0,0)) 

plot (ml.color,n.ahead=12,col='red',type='b',xlab='Year" 
ylab='Temperature') 

abline (h=coef (m1.color) 
[names (coef (m1.color))=='intercept'])) 


最 后 一 条 命令 在 估计 的 均值 〈 截 距 ) 处 添加 一 条 水 平 线 . 这 是 一 个 复杂 的 表述 .表达 式 coef 
(ml. color) 提取 系数 向 量 ， 系 数 向 量 的 元 素 都 已 经 被 命名 ， 向 量 的 名 称 可 以 通过 names HRM 
提取 ， 因 此 names (coef (ml. color)) 返 回 系数 向 量 元 素 的 名 称 向 量 . = 二 运算 符 逐 个 元 素 地 
比较 其 左右 两 侧 的 向 量 ， 根 据 元 素 是 否 相 等 最 后 得 到 一 个 由 TRUE 和 FALSE 构成 的 问 量 . 
(如 果 比 较 的 向 量 有 不 同 的 长 度 ， 那 么 R 将 会 重复 循环 短 的 向 量 以 与 长 的 向 量 还 配 ) 因 此， 
命令 

[names (coef (ml.color))== 'intercept'] 


返回 一 个 向 量 ， 在 “ 截 距 ”元 素 的 位 置 取 值 为 TRUE， 而 其 他 元 素 取 值 为 FALSE Ra, W 
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距 系 数 估计 量 通 过 “ 方 括号 ”运算 提取 . 

coef (ml .color) (names (coef (ml .color))=='intercept'] 
括号 中 的 运算 通过 两 种 机 制 之 一 得 到 向量 的 子 集 . Rv 是 一 个 向 量 . 其 子 向 量 可 以 通过 命令 v 
[sj 形成 ，s 是 一 个 长 度 与 v 一 致 的 布尔 型 向 量 〈 即 包含 TRUE M FALSE). v[s]Æ v 的 一 个 
THR, BAT v 中 的 那些 元 素 ， 对 应 着 s 中 取 值 为 TRUE 的 元 素 ; 而 对 应 于 s 中 为 FALSE 
的 v 中 的 元 素 不 为 vLsj] 所 取 . 

第 二 种 设立 子 向 量 的 方法 就 是 建立 s， 它 包含 了 要 保留 的 元 素 的 位 置 ，v[ sj 将 返回 所 需 子 
mR. 这 个 方法 的 一 个 变形 就 是 通过 删除 建立 子 向 量 ， 通过 把 它们 的 位 置 乘 以 - 1 来 标 出 不 需 
要 的 元 素 ， 例 子 如 下 : 

> v=1:5 


这 一 命令 建立 一 个 包含 前 五 个 正 整数 的 向 量 . 
11] 12345 


> names (v) 
NULL 


默认 设 定 中 ， v 的 元 素 没 有 命名 ， 因 此 names (Vv) 返 回 一 个 空 问 量 ， 用 对 象 NULL 标记 . 
> names(v)=c('A','B','C','D','E') 


这 是 给 向 量 元 素 分 配 名 称 的 方法 . 
> V 


> names (Vv) =='C' 
[1] FALSE FALSE TRUE FALSE FALSE 


查找 name (v) 的 哪个 元 素 是 “Cc”. 


命令 
> v[names (Vv) =='C'] 
3 

通过 布尔 值 提取 v 的 子 集 . 
命令 
> V[3] 
Cc 


3 
通过 提供 保留 元 素 位 置 的 方法 得 到 v 的 子 集 . 
命令 
> v[-3] 
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通过 提供 不 需要 元 素 位 置 的 方法 得 到 v 的 子 集 . 
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平稳 ARMA 过 程 的 理论 ACF 可 以 通过 ARMAacf 函数 计算 .az 参数 向 量 〈 如 果 存 在 的 
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活 ) 通过 参数 ar KARR. 类 似 的 ma 参数 向 量 通过 参数 ma 代 人 函数 ， 最 大 滞后 长 度 可 以 用 
参数 lag. max 设 定 ， 设 定 pact 参数 为 TURE， 计 算 理 论 pacf; 否则 函数 计算 理论 act. 作为 
例子 ， 考 虑 季节 MA 模型 ， 
Y, = (1 +0. 5B)(1 4+ 0. 8B" De, 
注意 (1 十 0.5B) (1 十 0.8B2) 一 (1 十 0.5B 十 0.8B2 十 0. 4B3)， 因 此 ，ma 系数 通过 选项 ma= c 
(0.5,rep(0,10),0. 8,0. 4) 来 设 定 ， 序 列 的 理论 ACF 显示 在 图 表 10-3 的 左 侧 ， 该 图 可 以 通过 
以 下 R 命令 获得 . 
plot (y=ARMAacf (ma=c(0.5,rep(0,10),0.8,9.4), 
lag.max=13) [-1]) ,x*=2=1:13,type='h', 
Xlab='Lag k',ylab=expression (rho[k]) ,axes=F,ylim=c(0,0.6)) 
points (y=ARMAacf (ma=c(0.5,rep(0,10),0.8,0.4), 
lag.max=13) [-1] ,x=1:13,pch=20) 
abline (h=0) 
axis(1,at=1:13, 
labels=c(1,NA,3,NA,5,NA,7,NA,9,NA,11,NA,13) ) 
axis (2) 
text (x=7,y=.5, labels=expression(list (theta&=&-0.5, 
Theta&=&-0.8))) 
因为 图 表 的 标题 需要 用 到 希腊 字母 和 下 标 ， 标 题 信息 必须 通过 expression MARKT. 
运行 帮助 菜单 ? plotmath 了 解 更 多 如 何在 R 中 进行 数学 注释 的 内 容 . 
# Exhibit 10.10 
ml .co2=arima({co2,order=c(0,1,1), 
seasonal=list (order=c(0,1,1),period=12) ) 


参数 seasonal 提供 了 季节 性 ARIMA 模型 中 季节 部 分 的 信息 ， 它 要 求 一 个 list MR. 
季节 阶 数 由 名 为 order 的 部 分 提供 ， 季 节 周 期 通过 period MAMA. ANU bare iia 
arima MXT co2 序列 拟 合 季节 ARIMA, 1, DXO, 1, DrK. 


mi. co? 


该 命令 打印 拟 合 的 季节 ARIMA 模型 的 汇总 . 
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# Exhibit 11.5 


acf (as. vector (diff (diff (window (log (airmiles), 
end=c (2001,8)),12))),lag.max=48) 


表达 式 window (log (airmiles),end= c(2001,8)) 通 过 将 2001 年 8 月 设 定 为 新 的 结束 日 期 
的 方式 得 到 时 间 序 列 log (airmiles) 的 子 集 ， 对 这 个 子 时 间 序 列 先 进行 12 阶 滞后 的 季节 差分 ， 
然后 再 进行 常规 的 差分 ， 双 差分 序列 之 后 代 人 act 函数 用 以 计算 48 阶 滞后 的 样本 ACF. 


# Exhibit 11.6 

air.mi=arimax (log (airmiles) ,order=c(0,1,1),seasonal= 
List (order=c{(0,1,1) ,period=12), 
xtransf=data. frame (I911=1* (seq(airmiles) ==69), 
I911=1* (seq(airmiles) ==69)), 
transfer=list(c(0,0),c(1,0)), 
xreg=data. frame (Dec96=1* (seq (airmiles) ==12), 
Jan97=1* (seq(airmiles) ==13), 
Dec02=1* (seq(airmiles) ==84)) ,method='ML') 
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arimax AMD RS arima 果 数 ， 因 此 其 可 以 处 理 时 间 序 列 中 的 干扰 分 析 及 异常 值 〈 包 括 
AO M10). 假设 干扰 影响 过 程 的 均值 ， 相 对 未 受 于 扰 的 均值 函数 的 偏离 用 一 些 协 变量 的 AR- 
MA 滤波 器 的 输出 之 和 来 表示 ， 偏 差 被 称 作 传 递 函 数 . 构造 传递 函数 的 协 变量 通过 xtransf 
参数 以 矩阵 或 data. frame 的 形式 代 人 arimax 图 数 ， 对 每 个 这 样 的 协 变量 ， 其 对 传递 图 数 的 
贡献 以 动态 响应 形式 存在 ， 表 示 如 下 : 

(ay 十 a1B 十 … 十 a,.B*) 
aeb aB tpp PRE 
传递 函数 是 xtransf 参数 中 所 有 协 变量 以 某 ARMA 滤波 器 形式 表示 的 动态 响应 的 和 .， 滤波 器 
中 ARMA 的 阶 用 向 量 c (p,q) 表 示 . WR p= q= 0 ( 即 c (p,q)= c(0,0))， 协 变量 的 贡献 形 
如 ae 协 变量 ,， 如 果 c (p,q)= c(1,0)， 那 么 输出 变 成 


SE ay PEE, =a (HEE, +b PEE. +b 协 变量 -: 十 … 


传递 函数 中 动态 部 分 的 ARMA 阶 数 通 过 transf 参数 以 列表 形式 提供 ， 此 列表 包含 按照 
xtransf 参数 中 定义 的 协 变量 的 顺序 所 组 成 的 ARMA Birla) et. 因此 选项 


xtransf=data. frame (I1911=1* (seq(airmiles) ==69), 
I1911=1* (seq(airmiles) ==69)), 
transfer=list(c(0,0),c(1,0)) 


指示 arimax 函数 创建 两 个 名 为 1911 的 相同 协 变量 ， 该 变量 为 示 性 变量 ， 比 如 记 作 P., 2001 
年 9 月 取 值 为 1; 其 他 时 候 取 值 为 0， 传 递 函 数 是 阶 数 分 别 为 cC0，0) Med, 0) 的 9/11 示 性 
变量 的 两 个 ARMA 滤波 器 的 和 . 因此 ， 传递 函数 等 于 


w P, 十 一 一 一 一 一 万， 


(1 — aœ: B) 
等 价 于 如 下 形式 的 ARMA(1，1) 滤波 器 : 


{ (wo + wy) = ww B} p 
(1 — w: B) ' 


可 以 通过 以 下 选项 设 定 : 
xtransf=data.frame (I911=1* (seq(airmiles) ==69)), 
transfer=list(c({1,1)) 


时 间 序 列 中 的 可 加 异常 值 CAO) 可 以 被 组 合 为 示 性 变量 代入 xreg BR. 例如， 通过 下 
面 提供 的 参数 ， 三 个 潜在 的 AO 被 包含 在 模型 中 : 


xreg=data.frame (Dec96=1* (seq (airmiles)==12), 
Jan97=1* (seq (airmiles)==13), 
Dec02=1* (seq(airmiles) ==84) ) 


注意 第 一 个 潜在 异常 值 发 生 在 1996 年 12 月 .相应 的 示 性 变量 被 标记 为 Dec96， 通 过 公式 1* 
(seq(airmiles)== 12) 进 行 计算 ， 产生 一 个 向 量 ,该 向 量 除 了 第 十 二 个 元 素 等 于 1 以 外 其 
他 元 素 都 等 于 0， 长 度 与 airmiles 相同 .这 一 “简单 ”命令 的 有 关 细 节 如 下 . seq 函数 创建 
-个 向 量 ， 该 向 量 包 含 前 n 个 下 整数， 其 中 是 一 个 代 人 seq 函数 的 向 量 长 度 . 表达 式 seq 
(airmiles)== 12 创建 一 个 与 airmiles 具有 相同 长 度 的 向 量 ， 其 元 素 除 了 第 十 二 个 为 
TRUE 外 其 余 全 部 为 FALSE. 于 是 1* (seq(airmiles)== 12) 是 一 个 算术 表达 式 ， Sas 
Se AE A BO 46 2K A [a] EE (seq (airmiles)== 12) 转 化 为 二 元 癌 量 . 前 已 述 及 ，TRUE 值 
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被 转化 为 1，FALSE 值 被 转化 为 0. 乘 以 1 工 并 不 改变 转化 后 的 二 元 向 量 . 事实 上 ， 使 用 乘法 的 
目的 就 是 为 了 启动 从 布尔 值 向 二 元 值 的 变换 . 

对 这 个 例子 ， 未 受 干 扰动 的 过 程 假设 为 一 个 IMA(1，1) 过 程 ， 通 过 提供 的 参数 order= 
c (0,1,1) ,这 是 显然 的 . 一般 来 说 ， 季 节 性 ARIMA 未 受 于 扰 的 过 程 按照 与 arima 函数 相同 的 
设 定 方式 来 设 定 . 

air. ml 


该 命令 打印 出 拟 合 的 干预 模型 ， 显 示 如 下 : 


> air.ml 

Call: arimax(x=log(airmiles) ,order=c(0,1,1),seasonal= 
list (order=c(0,1,1),period=12) ,xreg=data. frame (Dec96= 
1* (seq (airmiles) ==12) ,Jan97=1* (seq (airmiles) ==13), 
Dec02=1* (seq(airmiles) ==84) ) ,method='ML', 
xtransf=data. frame (I911=1* (seq (airmiles) ==69) ,1911=1* 
(seq (airmiles) ==69)) ,transfer=list (c(0,0),c(1,0))) 


Coefficients: 
mal smal Dec96 Jan97 Dec02 I911-MAO 1911.1-AR1 I911.1-MA0 
-0.3825 -0.6499 0.0989 -0.0690 0.0810 -0.0949 0.8139 -0.2715 
s.e. 0.0926 0.1189 0.0228 0.0218 0.0202 0.0462 0.0978 0.0439 


sigma*2 estimated as 0.000672: log likelihood=219.99, aic=-423.98 


注意 ， 传 递 函数 分 量 中 由 示 性 变量 1911 的 首 个 实例 所 定义 的 参数 标记 为 1911-mMa0; 即 MACO) 

系数 .传递 函数 中 由 示 性 变量 I911 的 第 二 个 实例 所 定义 的 参数 则 标记 为 1911. 1- AR1 和 

1911. 1-MA0。 这 些 是 ARO) 和 MA(0) 系数 估计 . 
我 们 也 可 以 试验 一 下 等 价 的 参数 化 形式 对 9/11 示 性 变量 设 定 ARMA (1, 1) WEA. 


> air.mla=arimax(log(airmiles) ,order=c(0,1,1), 
seasonal=list (order=c(0,1,1),period=12), 
xtransf=data. frame (I911=1* (seq(airmiles)==69)), 
transfer=list(c(1,1)), 
xreg=data. frame (Dec96=1* (seq(airmiles) ==12), 
Jan97=1* (seq(airmiles) ==13), 
Dec02=1* (seq (airmiles) ==84) ) ,method='ML') 


> air.mla 

Call: arimax (x=log (airmiles) ,order=c(0,1,1) ,seasonal= 
list (order=c(0,1,1),period=12) ,xreg=data. frame (Dec96=1 
* (seq (airmiles) ==12) ,Jan97=1* (seq(airmiles) ==13) ,Dec02= 
1* (seq (airmiles) ==84) ),method='ML',xtransf= 
data. frame (1911=1* (seq (airmiles) ==69)) ,transfer= 
list(c(1,1))) 


Coefficients: 
mal smal Dec96 Jan97 Dec02 I911-AR1 I911-MAO I911-MA1 
-0.3601 -0.6130 0.0949 -0.0840 0.0802 0.8094 -0.3660 0.0741 
s.e. 0.0926 0.1261 0.0222 0.0229 0.0194 0.0924 0.0233 0.0424 
sigma^2 estimated as 0.000648: log likelihood=221.76, aic=-427.52 


注意 这 一 模型 的 参数 估计 值 与 前 一 个 模型 的 参数 估计 值 很 接近 ， 但 这 个 模型 拟 合 得 更 好 ， 这 可 


能 是 由 于 进行 最 优化 是 通过 数值 算法 实现 的 . 


# Exhibit 11.8 
Ninellp=1* (seq (airmiles)==69) 


该 命令 定义 9/11 示 性 变量 . 
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plot (ts (Ninellp*(-0.0949)+ filter(Ninelip, filter=.8139, 
method='recursive',side=1)*(-0.2715), 
frequency=12,start=1996) ,type='h',ylab='9/11 Effects') 


命令 
Ninellp* (-0.0949)+filter (Ninellp, filter=.8139, 
method='recursive',side=1) *(-0.2715) 


计算 估计 的 传递 函数 . 注意 命令 
filter (Ninellp, filter=.8139,method=’ recursive’ ,side=1) 
计算 (1- 0. 813 9* B)Ninellp. RM filter 对 作为 第 一 个 参数 赋值 的 输入 序列 执行 MA 或 者 
AR 滤波 ， 假 设 输入 是 向 量 x=c(zl ，r，…，z)， 那 么 由 MA 滤波 器 定义 的 输出 是 y= cO 
2 9 ee Vay 
Ve = Coks TC Tp Ty 
可 以 通过 以 下 命令 计算 : 
filter (x,filter=c(c0,cl,....,cgq) ,side=1). 
参数 side= 1 指明 在 计算 输出 值 时 ，MA 运算 对 当前 和 过 去 的 数值 进行 ， 为 了 计算 yl. HR 
知道 x0 WA. 因为 后 者 无 法 观测 到 ， 滤 波 器 将 其 设 定 为 Na, 因此 yl 也 是 NA， 在 这 种 情况 
F. y2.y3 等 都 可 以 计算 出 来 ， 对 输出 由 下 面 的 方程 递归 定义 的 AR BR a: 
We = Xe E ciyer a T'e F CY 
R 命令 为 
filter (x,filter=c(c1,c2,...,cp),method='recursive', 
side=1) 


注意 与 MA 滤波 器 情况 不 同 的 是 ， 滤 波 器 向 量 从 cl 开始 ， 方 程 中 不 存在 c0， 参数 method= 
'recursive' 意 味 着 是 AR 型 的 滤波 器 . 对 于 AR 滤波 器 ， 初 始 值 不 能 设 为 NA， 和 否则， 全 部 输出 
值 都 将 是 NA! 默认 的 初始 值 是 0， 尽 管 可 以 通过 参数 init 设 定 其 他 初始 值 . 

abline (h=0) 

添加 一 条 y 轴 截 距 为 0 的 水 平 线 . 


# Exhibit 11.9 
set .seed (12345) 
y=-arima.sim(model=list (ar=.8,ma=.5),n.start=158,n=100) 


模拟 一 个 样本 容量 为 100 的 ARMAC, 1) 序列 ,为 了 去 除 初始 值 的 短暂 影响 ， 我 们 去 掉 
一 些 初始 数据 ， 设 定 容 量 为 158， 去 掉 百 位 数 以 上 的 初始 值 一 般 可 以 确保 模拟 过 程 是 近似 平稳 
的 . 选择 158 并 没有 什么 特殊 的 原因 . 

yL10]j 

该 命令 打印 出 第 十 个 模拟 值 . 

vL10j= 10 

该 命令 把 第 十 个 数值 修改 为 10; 即 该 值 变 成 了 一 个 可 加 异常 值 ， 用 来 模仿 例如 书写 错误 
带 来 的 效果 . 


y=ts(y,freq=1,start=1) ; plot (y,type='0’) 
acf (y) 
pacf (y) 
eacf (y) 
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探索 性 分 析 建 议 建立 ARC) 模型 

misarima(y,order=c(1,0,0)); ml; detectAO(m1) 

该 命令 用 来 检查 拟 合 ARO) 模型 中 是 否 存在 任意 可 加 异常 值 (AO)， 这 一 检验 需要 估计 
误差 (新 息 ) 项 的 标准 差 ， 默认 设置 是 用 稳健 估计 方案 来 和 估计， 得 到 一 个 更 有 效 的 检验 ， 可 以 
通过 设 定 参数 robust= F 关闭 稳健 估计 方案 ， 如 下 所 示 : 

detectAO(ml, robust=F) 

该 命令 验证 了 非 稳健 估计 过 程 的 效力 较 小 ， 

detectIo (ml) 

该 命令 用 来 检验 拟 合 ARQ) 模型 中 是 否 存 在 任意 新 息 异常 值 (IO)， 因 为 在 第 10 个 数据 
处 发 现 AQ， 因 此 把 异常 值 作为 一 个 示 性 变量 加 入 下 面 的 模型 中 . 


m2=arima (ly,order=c(1,0,0),xreg=data.frame (AO=seq(y) ==10) ) 
m2 


# Exhibit 11.10 

data (co2) 

ml.co2=arima(co2,order=c({(0,1,1),seasonal=list 

(order=c(0,1,1),period=12) ) 

ml .Coz 

detectAD (ml .co2) 

detectIO(m1.co2) 

在 第 57 个 观测 数据 处 发 现 ID， 把 它 加 人 模型 

m4.co2=<arimax (co2,order=c(0,1,1), 

seasonal=list (order=c(0,1,1),period=12) ,io=c (57) ) 

IO 发 生 的 时 点 通过 参数 io 代入 arimax MRM. 参数 期 望 包 含 ID 位 置 的 列表 或 者 是 IO 的 
时 间 索 引 ， 或 者 是 给 出 季节 性 数据 的 年 份 和 月 份 的 形 如 c (year, month) Mm it; 对 其 他 类 型 
的 季节 性 数据 可 类 似 地 应 用 后 一 种 形式 ， 对 于 一 个 单独 的 ID， 在 代 人 参数 io 之 前 ， 没 有 必要 
把 单独 的 索引 向 量 置 人 列表 ， 

# Exhibit 11.11 

set . seed (12345) 

X=rnorm(105) 

Y=zlag(X,2)+.5*rnorm (105) 

命令 zlag(X,2)itS x 2 Brita. 

X= ts{x[- (1:5)],start= 1,freg= 1) 

该 命令 忽略 X 的 前 五 个 值 ， 并 且 把 余下 的 值 转化 形成 一 个 时 间 序 列 . 

Y= ts(YL- (1:5) ],start= 1,freq= 1) 

ccf (X,Y, yvlab= 'Ccr') 

该 命令 计算 与 Y 的 截面 相关 函数 ， 提 供 的 参数 ylab 在 此 处 用 来 代替 cof MARU 
ylab, E} “ACF”. 


# Exhibit 11.14 

data (milk) 

data (electricity) Pe 
milk.electricity=ts.intersect (milk, log (electricity) ) 

ts. intersect 图 数 在 每 个 时 间 序 列 都 有 数据 的 时 间 框 架 上 将 几 个 时 间 序 列 合并 在 一 起 ， 


得 到 一 个 时 间 序 列 和 矩阵 (面板 )， 当 两 个 序列 的 时 间 区 间 重 全 时 ， 对 象 milk. electricity 是 
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两 个 时 间 序 列 的 和 矩阵， 其 中 的 第 一 列 为 milk 序列 ， 第 二 列 则 是 electricity 的 对 数 . 
plot (milk.electricity, yax.flip=T) 
选项 yax. flip= 了 将 每 个 时 间 序 列 y 轴 的 标题 交替 翻转 ， 以 使 标注 更 加 清晰 . 
# Exhibit 11.15 


ccf (milk.electricity[,1],milk.electricity[,2], 
main='milk & electricity',ylab='CCF') 


表达 式 milk. electricity[, 1] 提取 milk FF fij, milk. electricityL, 2] # Re xt % 
electricity Jl. 

as. vector 函数 从 时 间 序 列 中 去 除 时 间 序 列 属性 ， 这 是 为 了 使 得 ccf 函数 绘制 截面 相关 
的 默认 设置 无 效 ， 你 可 能 想 去 掉 as. vector 函数 重复 这 一 命令 ， 看 看 依据 数据 周期 给 出 的 沛 
后 的 默认 标识 . 


-© ccf ((milk.electricity[,1]), (milk.electricity[,2]), 
main='milk & electricity',ylab='CCF') 


方 括号 运算 符 表 示 从 一 个 矩阵 〈 比 如 NM 中 ) 以 MLvl,v2] 的 形式 提取 子 和 矩阵. 其 中 vi 表明 
哪些 行 被 保留 ，v2 表示 哪些 列 被 保留 . 因此 子 和 矩阵 MLv1,v2j 包 含 保 留 的 行 与 列 交 义 点 处 MM 中 
的 所 有 元 素 ， 如 果 vi(v2) Re. 那么 所 有 的 行 ( 列 ) 被 保留 . 因此 ，ML,1J 是 一 个 简单 的 子 矩 
Mm, de M 的 第 一 列 . 但 是 ，R 采用 惯例 ， 将 仅 有 一 行 或 一 列 的 子 和 矩阵 看 作 向 量 ; 即 这 时 子 
矩阵 减少 一 个 维度 ， 这 一 惯例 在 很 多 情况 下 是 很 有 意义 的 ， 然而， 如 果 在 R 中 进行 矩阵 代数 计 
算 ， 该 惯例 可 能 会 导致 奇怪 的 错误 信息 ! 为 了 阻止 维 数 的 自动 减少 ， 使 用 MLvl,v2,drop= F]. 
与 设 定 哪些 行 或 列 需要 保留 在 子 矩 阵 中 相反 ， 可 以 通过 在 它们 的 位 置 前 增加 一 个 负 号 的 方式 设 
定 哪 些 行 或 列 需要 被 删除 .或 者 v1(v2) 可 以 被 设 定 为 布尔 型 向 量 ， 需 要 保留 (删除 ) 的 位 置 
用 TRUE (FALSE) 标 出 . 


# Exhibit 11.16 
me.dif=ts.intersect (diff (diff (milk,1l2)), 
diff (diff (log(electricity),12))) 
prewhiten(as.vector(me.dif[{,1]),as.vector(me.dif[,2]), 
ylab='CCF') 


prewhiten 函数 希望 通过 x 与 y 两 个 参数 得 到 两 个 时 间 序 列 输入 . 两 个 时 间 序 列 将 会 依 
#2 ARIMA 模型 进行 滤波 ， ARIMA 模型 可 以 通过 参数 x. model 提供 ,并且 应 该 是 arima mM 
数 的 输出 ， 如 果 ARIMA 未 被 提供 ， 将 会 对 z 序 列 拟 合 一 个 AR 模型 ，AR 的 阶 数 通过 最 小 化 
AIC 来 确定 ，prewhiten 函数 可 以 计算 和 绘制 序列 以 及 来 自 相同 模型 的 《提供 的 或 者 是 拟 
合 的 )y 序列 的 残 差 的 截面 相关 天 数 CCCP). 


第 12 章 R 命令 
下 面 介 绍 如 何 用 两 种 不 同 的 方式 实施 正 态 性 Jarque-Bera 检验 ， 首 先 ， 我 们 介绍 直接 方法 . 
skewness (r. cref) 
该 命令 计算 r. cref 序列 的 偏 度 . 
kurtosis (r. cref) 
该 命令 计算 数据 的 峰 度 ， 


length (r. cref)* skewness (r. cref)*2/6 
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length 函数 返回 代入 它 的 问 量 (时 间 序 列 〉 的 长 度 ， 因 此 上 面 的 表达 式 计算 了 Jarque- 
Bera 统计 量 的 前 半 部 分 . 

length (r. cref)* kurtosis (r. cref)*2/24 

计算 Jarque-Bera 统计 量 的 后 半 部 分 . 


JB=length(r.cref)* (skewness (r.cref)^2/6 + 
kurtosis (r.cref) *2/24) 


对 象 JB 包含 了 Jarque-Bera 统计 量 ， 命令 JB 打印 该 统计 量 . 命令 1- pchisq(JB,df= 2) 
计算 对 正 态 性 进行 检验 的 Jarque-Bera 检验 的 p fA. pchisq 函数 计算 x* 分 布 小 于 等 于 第 一 个 
参数 提供 的 数值 的 累积 概率 ，pchisq 函数 的 df 参数 给 出 了 y 分 布 的 自由 度 . 因为 p 值 等 于 
右 侧 尾部 区 域 ， 所 以 它 等 于 1 减 去 累积 概率 . 除了 pchisq， 其 他 与 y 分 布 有 关 的 函数 包括 
qchisq， 用 以 计算 分 位 数 ; dchisq， 用 以 计算 概率 密度 ; rchisq， 用 来 从 y 分 布 中 模拟 实 
MM. 使 用 R 中 的 帮助 可 以 对 这 些 函 数 有 更 多 了 解 . 对 其 他 概率 分 布 ， 也 存在 类 似 的 了 晴 数 . 与 
正 态 分 布 相关 的 是 cnorm,pnorm,dnorm 和 qnorm。 检 查 一 下 二 项 式 、 泊 松 和 其 他 分 布 相关 函 
数 的 用 法 . 

library (tseries) 

该 命令 加 载 tseries 库 ， 这 个 库 包 括 了 本 章 描述 的 分 析 所 需要 的 一 些 函 数 . 运行 library 
(help= tseries) 了 解 更 多 关于 tseries 包 的 信息 . 

jarque. bera. test (r. cref) 

该 命令 对 r. cref 序列 的 正 态 性 进行 Jarque-Bera 检验 . 


# Exhibit 12.9 
McLeod.Li.test (y=r .cref) 


该 命令 对 CREF 日 收益 率 运行 是 否 存在 ARCH 效应 的 McLeod-Li 检验 .函数 的 前 两 个 参 
数 分 别 是 object 和 y. 对 原始 数据 进行 检验 ， 时 间 序 列 通过 参数 y 提供 给 函数 .然后 函数 使 
用 平方 后 数据 的 自 相 关 函 数 计 算 Box-Ljung 统计 量 来 检测 条 件 异 方差 性 . 该 检验 使 用 平方 后 数 
据 的 前 m 个 自 相 关系 数 来 完成 ， 其 中 m 的 范围 从 1 到 由 参数 gof. lag 设 定 的 最 大 滞后 值 ， 如 
果 参 数 gof. lag 缺失 ， 默 认 设置 为 nlogio《n)， 其 中 为 样本 容量 . 

McLeod-Li 检验 也 可 以 应 用 于 对 数据 拟 合 的 ARMA 模型 的 残 差 . 例如 ， 我 们 发 现 美 元 / 港 
币 汇率 数据 服从 AR(1) 十 异常 值 模 型 .在 汇率 数据 模型 中 是 否 需要 包含 ARCH 效应 可 以 通过 
以 下 命令 检验 . 


McLeod.Li.test (arima (hkrate,order=c(1,0,0), 
xreg=data.frame(outlierl) ) ) 


注意 对 象 是 第 一 个 参数 ， 所 以 在 以 上 命令 中 拟 合 的 ARCD+HHERBERARK A R 
数 基于 来 自 拟 合 的 AR(1) 十 异常 值 模型 残 差 的 平方 计算 检验 统计 量 ， 如果 对 象 参数 被 直接 或 
间接 提供 ， 那 么 即使 参数 y 被 提供 ， 也 会 被 函数 忽略 .注意 对 原始 数据 进行 检验 ， 参 数 y 必须 


被 提供 ， 而 对 象 参 数 是 受 抑 制 的 ， 


# Exhibit 12.11 
set . seed (1235678) 
garch0l1.sim=garch.sim(alpha=c(.01, .9) ,n=500) 


garch. sim 函数 模拟 GARCH 过 程 ， 其 中 ARCH 系数 由 参数 alpha 提供 ，GARCH 系数 
由 参数 beta 提供 ， 样本 容量 通过 参数 n 代 人 函数 . 在 上 面 的 例子 中 ，alpha= c(. 01,. 9) 指 
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# Exhibit 12.25 
ml=garch (x=r.cref,order=c(1,1)} 


该 命令 对 r. cref 序列 拟 合 GARCH (1, 1) 模型 . garch 函数 用 极 大 似 然 法 信 计 
GARCH 模型 ， 时间 序列 通过 参量 x 提供 给 函数 ，GARCH 的 阶 数 通 过 参数 order 提供 . or- 
der 采用 了 c(p,q) WR. Hh p  GARCH MHP. qd ARCH 的 阶 . 

summary (m1) 

该 命令 给 出 拟 合 的 GARCH(1，1) 模型 的 汇总 ， 忽 略 报告 在 汇总 中 的 Box-Ljung RHA 


果 ， 因 为 应 该 使 用 广义 混合 检验 ， 参 阅 书 中 的 内 容 . 


# Exhibit 12.29 
gBox (m1,method=' squared') 


gBox 函数 计算 广义 混合 检验 ， 用 来 检查 拟 合 的 GARCH 模型 的 残 差 中 是 理 存 在 任何 残 差 
异 方差 . 用 garch 函数 拟 合 的 GARCH 模型 需要 通过 第 一 个 参数 (模型 参数 ， 函 数 的 第 一 个 
参数 ) 提供 给 该 函数 .在 默认 设置 中 ， 检 验 对 来 自 拟 合 的 GARCH 模型 的 残 差 平方 进行 ， 要 
想 检 查 残 差 的 绝对 值 ， 使 用 选项 method= 'absolute'.， 在 默认 设置 中 ,检验 是 对 1 阶 到 例 
fl K BG ACF 进行 的 ，K 的 范围 从 1 到 20，K 的 集合 通过 lags 参数 提供 ， 例 如 ， 为 了 完成 
K 从 1 到 30 的 检验 ， 需要 提供 选项 1ags= 1:30. 

gBox (m1, lags=20,plot=F,x=r.cref, method='squared') $pvalue 

打印 对 残 差 平方 和 K=20 进行 的 广义 混合 检验 的 p 值 ， 即 基于 拟 合 GARCH 模型 残 差 平 
方 的 前 20 MAE ACF， 检 验 是 否 存 在 任何 残 差异 方差 .通过 选项 plot= F 关 团 绘图 功能 . 
gBox 函数 返回 一 个 列表 ， 其 中 名 为 pvalue 的 参数 包含 对 于 每 个 KITEEN p E. AE, 
该 命令 打印 出 K= 20 时 检验 的 记 值 . 


# Exhibit 12.30 
acf (abs (residuals (m1) ) ,na.action=na.omit) 


由 于 来 自 拟 合 GARCH 模型 的 最 初 几 个 残 差 可 能 会 缺失 ， 因 此 有 必要 通过 参数 na. 
action= na. omit 指示 ACF 函数 忽略 所 有 缺失 数值 . 〈 当 遇 到 缺失 数值 时 ， 最 好 的 方法 就 是 
忽略 它 . ) 如 果 该 参数 被 忽略 ，acf 函数 会 使 用 所 有 的 数据 ， 如 果 存 在 任何 缺失 值 ， 将 会 返回 
缺失 值 . 

可 以 通过 以 下 命令 对 CREF 收益 率 过 度 拟 合 GARCH(1，2) 模型 . 


m2=garch (x=r. cref,order=c (1,2)) 
summary (m2, diagnostics=F) 


汇总 使 用 tseries 包 中 summary. garch 函数 得 到 ， 注 意 汇 总 中 的 Ljung-Box 检验 的 上 
值 是 无 效 的 ， 作 为 替代 应 该 使 用 广义 混合 检验 ， 因 此 关闭 诊断 检验 ， 

AIC (m2) 

该 命令 计算 拟 合 GARCH 模型 ml 的 AIC. 


# Exhibit 12.31 
gBox(m1,x=r.cref,method='absolute') 


该 命令 执行 对 残 差 绝对 值 进行 的 广义 混合 检验 . 


shapiro.test (na.omit (residuals (m1) ) ) 
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Kt > ST HL TN ml A RE IE AS HEEFT Shapiro-Wilk 检验 .na. omit 函数 删除 了 残 差 
中 所 有 的 缺失 值 .。 因此 该 检验 对 没有 缺失 值 的 残 差 进行 ， 如果 未 通过 na. omit MARK 
了 预 处 理 ， 那 么 如果 有 一 些 残 差 缺失 ， 检 验 将 会 返回 一 个 缺失 值 . 

# Exhibit 12,32 


plot ((fitted(m1) {,1])*2,type='1', 
ylab='conditional variance',xlab='t') 


fitted 函数 是 一 个 智能 函数 ， 根 据 作 为 第 一 个 参数 赋值 的 拟 合 模 型 的 不 同 执行 不 同 的 操 
E. 如 果 拟 合 模 型 是 garch 函数 的 某 个 输出 ， 那 么 fitted 函数 的 默认 输出 是 一 个 两 列 的 矩 
阵 ， 第 一 列 包 会 一 步 前 向 条 件 标 准 差 。 因此， 它们 的 平方 是 条 件 方差 .所 以 (fitteqd (ml)[， 
1]) “2 计算 基于 模型 ml 估计 的 一 步 前 向 条 件 方差 时 间 序 列 ， 


第 13 章 R 命令 
# Exhibit 13.3 
可 以 通过 periodogram 函数 对 作为 第 一 个 参数 赋值 的 数据 计算 和 绘制 时 间 序 列 的 周 


期 图 . 
sp=periodogram(y); abline(h=0) ; 
axis (1,at=c (0.04167, .14583) ) 


periodogram 函数 有 几 个 有 用 的 参数 . 4 log= 'yes'， 表 示 让 R 在 对 数 标 度 下 绘图 ， 
而 log= 'no' (RUBE) 表示 让 R 在 线性 标 度 下 绘图 绘图 耻 数 的 其 他 参数 也 可 以 代入 函 
数 以 绘制 更 加 合适 的 图 形 ，axis 函数 绘制 一 条 轴线 ， 第 一 个 参数 设 定 轴线 绘制 的 工作 区 . T 
作 区 从 底部 开始 按 顺 时 针 方向 从 1 到 4 标记 . 刻度 线 位 置 向 量 可 以 通过 参数 at 设 定 .上 面 的 
命令 指示 RR 在 图 形 的 底部 画 一 条 (附加 的 ) 轴线 ， 刻 度 线 位 于 0. 041 67 和 0.145 83 Ab. 


# Exhibit 13.9 
theta=.9 # Reset theta for other MA(1) plots 
ARMAspec (model=list (ma=-theta) ) 


ARMAspec 消 数 计算 和 绘制 作为 第 一 个 参数 代 人 函数 的 ARMA HR HI Ee Oe EE PS. 
记得 在 MA 部 分 的 设 定 中 R 使 用 正 号 的 习惯 ， 因 此 theta 前 加 一 个 负 号 ， 模 型 的 格式 与 ari- 
ma 函数 一 样 . 
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# Exhibit 14.2 

spec pei AC A at iE Fs 24 A A oR BT A SE Fm BE a i aE Pa. spec AA 
有 上 几 个 有 用 的 参数 . $ logs 'yes', mit R 在 对 数 标 度 下 绘图 ， 而 log= 'no'. Rail R 
在 线性 标 度 下 绘图 ， 令 detrend= T， 可 以 去 掉 数 据 的 趋势 〈 拟 合 一 个 线性 时 间 趋 势 )， 并 且 
通过 令 锥 削 为 介 于 0 到 0.5 之 间 的 某 个 小 数 强 制 进行 锥 前 .默认 的 选项 为 taper= 0, 
detrend= F. 

k=kernel ('daniell',m=15) 

这 里 ， 对 象 k 包含 半 带 宽 为 15 的 Daniell 核 函数 ， 通 过 肛 的 帮助 文件 了 解 更 多 关于 ker- 
nel PB ay AR. 
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sp=spec (y, kernel=k,log='no',sub='', 
xlab='Frequency',ylab='Smoothed Sample Spectral Density') 


BAKA Daniell {ew AN R 计算 和 绘制 谱 密度 估计 ， 其 中 在 某 一 特定 频率 的 估计 通过 对 
当前 (原始 ) 周期 图 值 〈 包 括 左 侧 相 邻 的 15 个 周期 图 值 和 右 侧 相 邻 的 另外 15 个 周期 图 值 ) 求 
平均 得 到 ， 用 更 多 或 更 少 的 数据 进行 局 部 平均 可 以 通过 核 函 数 的 参数 m 来 设 定 . 


lines (sp$freq, ARMAspec (model=list (ar=phi) , freq=sp$freq, 
plot=F) $spec, lty='dotted' ) 

该 命令 添加 理论 谱 密度 函数 . 

# Exhibits 14.11 14.12 

# 模拟 序列 的 谱 分 析 

set .seed (271435) 

n=100 

phil=1.5; phi2=-.75 # Reset parameter values to obtain 
Exhibits 14.13 & 14.14 

y=arima.sim(model=list (ar=c(phil,phi2) ) ,n=n) 


该 命令 模拟 一 个 长 度 为 100 的 ARC) 时 间 序 列 . 
spl=spec(y,spans=3,sub='',lty='dotted', xlab='Frequency', 
ylab='Log(Estimated Spectral Density) ') 


该 命令 使 用 修正 后 的 Daniell 核 (在 kernel 参数 缺失 并 且 spans 参数 被 提供 的 时 候 是 默认 
核 ) 估计 特殊 的 密度 函数 .参数 spans 提供 了 核 肾 数 的 宽度 ; 即 该 值 是 核 函 数 中 参数 m 的 两 
倍加 1， 此 处 spans= 3 表明 对 三 个 连续 周期 图 的 值 求 平均 。 注意 通过 把 向 量 代 入 spans, "j 
以 重复 进行 局 部 平均 ， 例 如 ， 设 定 spans= c(3,5) 执 行 两 次 局 部 平均 . 通过 spans= 3 局 部 平 
均 得 到 估计 的 函数 ， 再 通过 spans= 5 局 部 平均 一 次 . 使 用 修正 后 的 Daniell GB) 核 重 复 平 
均 ， 由 于 中 心 极限 效用 ， 类 似 于 使 用 钟 形 核 求 平均 . 

sp2=spec (y, spans=9, plot=F) 

此 命令 使 用 包含 9 个 周期 图 的 更 大 的 窗 宽 计算 谱 估 计 ， 并 且 通 过 参数 plot= F 不 进行 给 
Al. spec 函数 的 输出 保存 在 名 为 sp2 的 对 象 中 . 

sp3=spec (y, spans=15,plot=F) 

该 命令 使 用 了 更 宽 的 窗 . 在 每 次 局 部 平均 中 包括 多 少 个 周期 图 值 呢 ? 

lines (sp2$freq, sp2$spec, lty='dashed' ) 

该 命令 用 虚线 (spans= 9) 绘制 更 平滑 的 谱 估 计 . 

lines (sp3$freq, sp3$spec, lty='dotdash') 

该 命令 用 点 虚线 (spans= 15) 绘制 最 平滑 的 谱 估 计 . 

f=seq(0.001, .5,by=.001) 

该 命令 创建 一 个 从 0. 001 开始 到 0. 5 结束 的 数字 序列 ， 增 量 为 0.001， 然 后 保存 在 对 象 
f 中 . 


lines (f, ARMAspec (model=list (ar=c(phil,phi2)),freq=f, 

plot=F) $spec,lty='solid') 
该 命令 对 设 定 的 ARMA 模型 绘制 理论 谱 密度 函数 图 ,在 估计 的 谱 密 度 图 上 用 连续 的 线 
# Exhibit 14.12 


sp4=spec (y,method='ar',lty='dotted', xlab='Frequency', 
ylab='Log(Estimated AR Spectral Density) ') 
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该 命令 使 用 通过 最 小 化 AIC 拟 合 的 AR E pye Se E R BOR TH HHN E E 0 BL. 
f=seq{0.001, .5,by=.001) 
lines (f, ARMAspec (model=list (ar=c(phil,phi2)), 

freq=f,plot=F) S$spec,lty='solid') 


该 命令 绘制 理论 谱 密度 函数 . 
sp4smethod 
该 命令 显示 所 选 AR 模型 的 阶 . 
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# Exhibit 15.1 

set .seed (2534567) 

par (mfrow=c (3,2) ) 

y=arima.sim(n=61,model=list (ar=c(1.6,-0.94) ,ma=-0.64) ) 


该 命令 模拟 一 个 样本 容量 为 61 BY ARMA (2, 1) FJ. 

lagplot (y) 

wae liebe, Fer HR R a AB Ree, FART RAPS 
加 一 条 平滑 曲线 . 平滑 曲线 通过 对 数据 进行 局 部 线性 拟 合 得 到 ， 通 过 增加 参数 nn 设 定 的 数值 
(默认 值 为 nn 二 0.7)， 局 部 拟 合 方 案 使 用 更 局 部 的 数据 ， 产 生 一 个 更 平滑 的 拟 合 ， 因 为 曲线 更 
平滑 因此 可 能 具有 更 大 的 偏差 和 较 小 的 变化 ， 相 反 ， 减 少 参 数 nn 的 值 会 产生 一 个 更 粗略 的 拟 
合 ， 由 于 不 太平 滑 因而 拟 合 的 偏差 比较 小 但 是 变化 更 大 ， 时 间 序 列 应 变量 对 7 阶 淖 后 绘制 的 散 
点 图 中 的 平滑 曲线 估计 了 给 定 7 阶 滞后 下 作为 应 变量 ; 阶 潭 后 函数 的 应 变量 的 条 件 均 值 ， 根 据 
默认 设 定 ，lagplot 函数 绘制 滞后 回归 图 ， PARMA 1 到 6， 更 多 的 请 后 可 以 通过 设置 
lag. max 参数 计算 . Pld, lag. max= 12 是 计算 1 阶 滞后 到 12 Gra VAR. YER lagplot 
函数 需要 安装 RPA locfit 包 . 


# Exhibit 15.2 
data (veilleux) 


数据 集 veilleux 是 一 个 包含 两 个 时 间 序 列 的 矩阵 ， 第 一 列 是 Didinium 丰 度 序列 ， 第 二 
列 是 Paramecium 丰 度 序列 ， 每 个 序列 都 是 每 12 个 小 时 记录 一 人 次， 基础 时 间 单 位 为 天 ， 因 此 序 
列 的 频率 为 2， 即 一 天 抽样 两 次 . 

predator=veilleux[,1] 

该 命令 定义 predator 序列 为 Didinium 丰 度 序列 . 


plot (log (predator) ,lty=2,type='b',xlab='Day'’, 
ylab='Log (predator) ') 


该 命令 用 虚线 绘制 完整 的 对 数 转 化 后 的 predator 序列 . 

predator.eq=window (predator, start=c(7,1)) 

该 命令 把 predator 序列 中 从 实验 第 七 天 开始 看 起 来 “平稳 的 ”部 分 构造 为 一 个 子 集 ， 接 下 
来 在 书 中 报告 的 关于 predator 序列 的 分 析 都 是 针对 这 个 对 数 转 化 后 的 平稳 子 序列 进行 的 . 

lines (log(predator.eq) ) 

该 命令 用 实 线 绘制 出 平稳 部 分 . 

indexi=zlag (log [predator .eq) ,3)<=4.661 

zlag (log (predator. eq), 3) 命令 返 回 (经 对 数 变 换 的 ) predator 序列 的 3 Britian. A 
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达 式 zlag (log (predator. eq),3)<= 4. 661 计算 一 个 布尔 型 向 量 ， 当 且 仅 当 predator 序 
列 3 阶 王 后 的 相应 元 素 小 于 等 于 4. 661 时 ， 该 布尔 型 向 量 的 值 为 TRUE， 布尔 型 向 量 保存 在 名 
为 indexl 的 对 象 中 ， 其 他 比较 符号 ， 包 括 盖 = ，> 盖 ， 一 和 = 一 也 可 用 来 比较 比较 操作 符 两 侧 
的 向 量 ， 在 上 面 的 例子 中 ， 一 一 号 左 侧 是 一 个 向 量 ， 但 是 右 侧 是 一 个 标量 ! 这 个 不 一 致 可 以 通 
过 循环 规则 来 解决 ， 即 R 重复 复制 短 向 量 直到 与 较 长 的 部 分 匹配 ， 注 意 等 号 符号 用 双 等 号 二 = 
表示 ， 因 为 一 个 等 号 代表 赋值 运算 ， 


points (y=log (predator .eq) [index1] , (time (predator.eq) ) 
[index1] , pch=19) 


该 命令 用 实心 圆 (pch= 19) 绘 制 捕食 者 丰 度 序列 的 3 BHD) FE 4. 661 的 数据 点 ， 运 
行 命 令 ? points 了 解 更 多 数据 点 绘图 样式 . 


# 非 线 性 检验 
Keenan.test (sqrt (spots) ) 


该 命令 执行 Keenan 的 线性 检验 ， 在 线性 零 假设 下 AR 过 程 有 效 阶 数 可 以 通过 参数 order 
提供 .例如 order= 2 即 设 定 有 效 AR MMA 2， 如 果 参 数 order 缺失 ,那么 阶 数 由 ar BH 
通过 最 小 化 AIC 自动 确定 ， 默 认 设 定 中 ，ar wR YuleWalker WHR. (A 
调用 Keenan. test 函数 时 ， 可 以 通过 包含 参数 method 选择 其 他 估计 方法 ; 例如 ，method= ' 
mle' 指 明 在 ar 郴 数 中 使 用 极 大 似 然 估计 法 ， 

Tsay.test (sqrt (spots) ) 

该 命令 运行 Tsay 的 线性 检验 ; BR] Tsay(1986). Tsay. test 国 数 的 设计 以 及 参数 与 


Keenan. test 函数 相似 . 


# Exhibit 15.6 
y=qar.sim(n=100, const=0.0,phi0=3.97, 
phil=-3.97,sigma=0,init=.377)} 


gar. sim 函数 根据 一 阶 二 次 AR 模型 模拟 时 间 序 列 的 实现 ， 其 中 phi0 是 1 Bria NA 
数 ，phil 是 i 阶 滞后 平方 的 系数 .默认 截 距 为 0， 否则 可 以 通过 参数 const RE. RAMA 
差 通过 参数 sigma RAKS. Ab, sigma- 1 设 定 标 准 差 为 1， 参数 n=15 设 定 样本 容量 为 
15. 最后， 参数 init= . 377 设 定 初始 值 为 0. 377. 默认 的 初始 值 为 0. 

plot (x=1:100,y=y,type='1',ylab=expression(Y{[t]),xlab='t') 

gar. sim 函数 的 输出 是 一 个 向 量 . 为 了 画 出 时 序 图 ， 必 有 需 指 明 x 变量 和 y 变量 . 


# Exhibit 15.8 

set.seed (1234579) 

y=tar.sim(n=100, Phil=c(0,0.5) ,Phi2z=c(0,-1.8) ,p=1,d=1, 
sigmal=1,thd=-1,sigma2=2) $y 


tar. sim 函数 根据 双 区 域 TAR 模型 模拟 时 间 序 列 的 实现 .模型 的 阶 通过 参数 p 设 定 ， 因 
lt, p= 1 设 定 该 模型 为 一 阶 模型 . 延迟 通过 参数 da 代 人 函数 ， 因 此 d= 1 REIRA L FR 
域 (上 区 域 ) 中 AR 系数 向 量 以 截 距 为 首 个 组 成 部 分 ， 通过 参数 phil (Phi2) 提 供 . 参数 
thd= - 1 假设 门限 参数 为 一 1， 上 区 域 和 下 区 域 的 新 息 标 准 差 分 别 通 过 参数 sigmal 和 sigma2 
设 定 .在 这 个 例子 中 模拟 的 TAR 模型 是 条 件 异 方差 的 ， 因 为 上 区 域 的 新 妃 标 准 差 是 下 区 域 新 
息 标 准 差 的 两 倍 ， 样 本 容量 通过 参数 n= 100 设 定 为 100. 

在 正 态 分 布 新 息 假设 下 ， 对 门限 非 线性 的 似 然 比 检验 可 以 通过 tlrt 函数 完成 ， 数 据 作为 
第 一 个 参数 输入 函数 .其 他 需要 的 信息 包括 order 参数 和 delay BR. 另外 ， 门 限 参 数 必 须 
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从 数据 的 a 乘 以 100% Fb FEW 100“HMA AK PMR. 多 数 情 况 下 ， 在 进行 非 线 性 检验 之 
前 需要 对 数据 进行 变换 ， 这 可 以 通过 提供 变换 后 的 数据 或 者 提供 原始 数据 及 变换 参数 来 设 定 . 
可 以 使 用 的 变换 选项 包括 : 'no' (意味 着 没有 变换 ， 是 默认 设置 )，'1log','log10'， 或 者 ' 
sqrt'. 例如 ， 以 下 命令 进行 似 然 比 检验 ， 零 假设 是 经 过 开 方 变换 的 相对 太阳 黑子 数据 满足 
ARG) 过 程 ， 备 择 假设 是 序列 满足 延迟 为 1 的 5 阶 门限 模型 ,门限 参数 从 【变换 后 ) 数据 的 
第 一 到 第 三 四 分 位 数 中 搜索 . 

tlrt (sqrt (spots) ,p=5,d=1,a=0.25,b=0.75) 

tlrt 函数 输出 包含 检验 统计 量 和 p 值 的 列表 .在 实际 中 ， 虽 然 门 限 可 能 位 于 1 和 模型 的 
阶 之 间 ， 但 门限 模型 的 真实 延迟 是 未 知 的 (如 果 认 为 适当 ， 延 迟 也 可 以 设 为 大 于 阶 的 某 些 数 
值 ) 对 每 个 可 能 的 延迟 值 ， 可 以 多 次 重复 上 述 命令 ,一 种 更 简练 的 方式 是 使 用 for 循环 ， 具 
体 方 法 如 下 : 


# 门限 非 线性 检验 
pvaluem=NULL 


该 命令 定义 了 一 个 名 为 pvaluen 的 空 的 对 象 . 
for (d in 1:5) 


{res=tlrt (sqrt (spots) ,p=5,d=d,a=0.25,b=0.75) ; pvaluem= 
cbind (pvaluem, c (d, res$test.statistic, res$p.value) ) } 


对 每 个 a 值 重复 运行 大 括号 内 的 语句 ， 变 量 a 顺序 取 自 包含 前 五 个 正 整 数 的 向 量 1 : 5. 
因此 ， 首 先 设 d 等 于 1， 运 行 门限 非 线 性 的 似 然 比 检验 ， 输 出 保存 在 名 为 res 的 对 象 中 .命令 
c(d,res$ test. statistic,res$ p. value) 创 建 一 个 向 量 ,， 该 向 量 包含 数值 1!、 似 然 比 检验 
统计 量 及 其 p 值 ， 然 后 这 样 创建 的 向 景 被 添加 在 pvaluem 的 右 侧 形成 一 个 矩阵 ， 因 此 ， 第 一 
次 循环 后 ，pvaluem 是 包含 d= 1 的 检验 结果 的 和 矩阵. 然后 循环 设 d 等 于 第 二 数值 ， 即 2; 对 
d= 2 的 执行 门限 似 然 比 检验 ; 把 d= 2 的 检验 结果 增添 到 pvaluenm 的 右 侧 ;如 此 直到 穷尽 aM 
n 的 所 有 可 能 取 值 ，R 退出 循环 . 

rownames (pvaluem)=c('d','test statistic','p-value') 

该 命令 为 pvaluem 和 矩阵 的 行 添加 标记 ， 第 一 行 记 为 “d"， 第 二 行 记 为 “test statis- 
tic”， 第 三 行 记 为 “p-value”. 

round (pvaluem, 3) 

该 命令 打印 检验 结果 的 矩阵 〈 表 格 )， 结 果 保 留 到 小 数 点 后 三 位 数 . 注意 ， 可 通过 明确 
pvaluem 为 有 适当 维 数 的 矩阵 来 提高 上 述 R 代码 计算 的 效率 ，( 例 如，Ppvaluem= matrix (' 
NA',nrow= 3,ncol= 5)) 在 这 个 矩阵 中 保存 着 检验 结果 . 


# Exhibit 15.12 
predator.tar.1l=tar (y=log (predator .eq) ,pl=4,p2=4,d=3,a=.1, 
b=.9,print=T) 


该 命令 对 〈 经 对 数 变换 的 ) predator. eq 序列 拟 合 门限 模型 ， 上 区 域 和 下 区 域 的 最 大 化 
AR 阶 数 均 为 4，d= 3， 门 限 参数 从 第 10 百 分 位 数 到 第 90 百 分 位 数 之 间 进 行 搜索 ,如果 打 印 
参数 设 为 T， 则 打印 拟 合 模型 .默认 设置 中 ， 函 数 使 用 MAIC (最 小 化 AIC) 法 进行 估计 ， 
AR 的 阶 也 用 同样 的 方法 估计 . 另 一 个 估计 方法 是 条 件 最 小 二 乘法 ， 可 以 通过 method= 'CLs' 
来 设 定 ， 正 如 下 面 的 命令 所 表示 的 那样 . 

在 下 面 的 命令 中 ， 我 们 使 用 CLS 法 重新 进行 估计 .注意 CLS 法 并 不 估计 两 个 区 域 上 AR 
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的 阶 ， 作 为 替代 ， 通 过 参数 pl Al p? 设 定 的 最 大 阶 数 作为 AR 的 阶 ! 这 就 是 为 什么 pl 和 p2 的 
值 与 之 前 命令 的 设 定 不 同 ， 事实 上 这 里 阶 数 被 设 定 为 使 用 MAIC 法 估计 模型 得 到 的 阶 . 


tar (y=log(predator.eq) ,pl=1,p2=4,d=3,a=.1,b=.9,print=T, 
method='CLS' ) 


# Exhibit 15.13 
tar.skeleton(predator.tar.1) 


该 命令 计算 作为 第 一 个 参数 的 TAR 模型 的 骨架 ， 软 认 样 本 容量 为 500 个 值 ， 烧 和 500 个 
值 ， 并 绘制 骨架 最 后 50 个 值 的 时 序 图 .TAR 模型 通常 是 tar RP object 参数 的 输出 ， 此 
外 ， 模 型 参数 可 以 按照 类 似 于 tar. sim 函数 的 格式 来 设 定 .函数 还 打印 出 骨架 长 期 行为 的 


总 ， 
# Exhibit 15.14 
set .seed (356813) 
plot (y=tar.sim(n=57,o0bject=predator.tar.1)$y,x=1:57, 
ylab=expression(Y([t]),xlab=expression(t),type='o') 
该 命令 绘制 根据 对 捕食 者 序列 拟 合 的 TAR(2; 1, 4) 模型 模拟 的 时 间 序 列 . 拟 合 模型 通 


过 object 参数 提供 . 
# Exhibit 15.20 
tsdiag (predator.tar.1,gof.lag=20) 


该 命令 对 用 捕食 者 序列 拟 合 的 TAR(2; 1, 4) 模型 执行 几 个 模型 诊断 检验 ， 这 个 函数 给 
制 标准 残 差 的 时 间 序 列 图 ， 残 差 ACF 以 及 广义 混合 检验 的 p 值 序列 ， 参 数 gof. lag= 20 指明 


最 后 两 个 图 使 用 的 最 大 化 沛 后 是 20. 
# Exhibit 15.21 
qqnorm(predator.tar.1$std.res) 


该 命令 对 用 捕食 者 序列 拟 合 的 TAR(2; 1, 4) 模型 的 标准 残 差 绘 制 分 位 数 一 分 位 数 正 态 
得 分 图 . 
qqline (predator.tar.1$std.res) 


在 QQ 图 中 添加 辅助 线 . 


# Exhibit 15.22 

set .seed (2357125) 

pred. predator=predict (predator.tar.1,n.ahead=60, 
n.sim=1000) 


et > RE WA 2 rE BU A 门 限 模 型 (通常 是 tar 函数 的 输出 9 此 处 为 predator. tar. 1} 
为 条 件 的 未 来 值 的 条 件 分 布 模拟 一 个 时 间 序 列 ， 最 大 预测 水 平 为 60 步 前 向 预测 、 点 预测 及 其 
95% 预 测 极限 用 模拟 方法 计算 ， 模 拟 的 容量 设 定 为 n. sim= 1000. M% predict 的 输出 是 一 个 
列表 ， 在 名 为 fit 的 组 成 部 分 (元素) 中 包含 向 量 形式 的 预测 均值 ， 在 pred interval 部 分 
包含 矩阵 形式 的 下 和 上 预测 极限 .predict 函数 是 一 个 智能 型 函数 ， 可 以 识别 第 一 个 参数 是 
TAR 模型 ， 基 于 该 模型 计算 预测 值 . 运行 ? predict. TA 可 以 了 解 更 多 关于 TAR 模型 的 
predict 函数 的 内 容 ， 扩 展 名 TAR 表示 根据 TAR 模型 进行 预测 的 特殊 预测 函数 . 


yy=ts (c (log (predator.eq) ,pred.predator$fit) , frequency=2, 
start=start (predator.edq) ) : 


该 命令 把 点 预测 值 添加 到 数据 中 . 


plot (yy, type='n', | 
ylim=range {c (yy, pred.predator$pred.interval)), 
ylab='Log Prey', xlab=expression (t) ) 
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该 命令 设置 数据 和 预测 值 的 图 形 ， 但 是 并 没有 实际 绘图 (type= 'n'). RAFA bn, 
因此 y 轴 的 范围 通过 参数 ylim 设 定 为 通过 range 函数 计算 得 到 的 观测 值 十 预测 值 癌 量 (yy) Si 
测 极 限 (pred predator$ pred interval) 向 量 的 合并 向 量 的 最 小 值 和 最 大 值 向 量 . 


lines (log (predator.eq) ) 


该 命令 绘制 数据 的 实 线 图 . 
lines (window (yy, start=end(predator.eq)+c(0,1)),1ty=2) 


该 命令 以 虚线 的 方式 添加 预测 值 的 曲线 . 

lines (ts (pred.predatorSpred.interval (2,1, 
start=end (predator.eq)+c(0,1),freq=2) ,lty=2) 

该 命令 添加 预测 上 限 ， 

lines (ts (pred.predatorSpred.interval[l1,], 
start=end (predator.eq)+c(0,1),freq=2) ,lty=2) 

该 命令 添加 预测 下 限 . 

# Exhibit 15.24 

qqnorm (pred.predatorS$pred.matrix[,3]) 


predict 函数 的 输出 是 一 个 列表 ， 包含 名 为 pred. matrix 的 男 一 个 组 成 部 分 ， 这 一 组 成 


部 分 是 包含 所 有 未 来 值 的 矩阵 ， 第 一 列 包含 模拟 的 一 步 向 前 预测 值 ， 第 二 列 包含 两 步 向 前 预测 
H. FF. 


qaqnorm (pred.predator$pred.matrix[,3]) 
该 命令 提取 全 部 1000 个 模拟 三 步 向 前 预测 值 ， 然 后 代入 qqnorm 函数 ， 以 绘制 这 些 数 据 


的 QQ 正 态 得 分 图 . 


qqline (pred.predatorSpred.matrix[,6]) 
该 命令 添加 辅助 直线 用 以 检查 三 步 向 前 预测 条 件 分 布 的 正 态 性 , 
最 后 ， 给 出 TSA 包 中 的 所 有 新 的 或 改进 的 函数 的 简 述 列表 . 


函数 
act 
arii 
arima. boot 
arimax 
ARMAsSpec 


armasubsets 


BoxCox. ar 


detectAD 
detectIo 
ence 

garch. sim 


qgBox 


TSA 库 中 的 新 丽 数 或 改进 函数 
描述 
计算 并 绘制 从 1 阶 滞后 开始 的 样本 自 相关 函数 
该 函数 已 修改 为 计算 本 书 所 定义 的 AIC 


关于 拟 合 ARIMA (p, dy gp) 模型 的 自助 时 间 序列 


扩展 arima 函数 ， 以 包含 传递 函数 、 新 息 和 可 加 异常 值 

计算 并 绘制 ARMA 模型 的 理论 谱 

求 “ 最 优 子 集 ”ARMA 模型 

找到 一 个 每 变换 ， 以 使 变换 后 的 时 间 序 列 通 近 一 个 有 正 态 误差 项 的 AR 过 程 
检验 时 间 序列 中 的 可 加 异常 值 。 

检验 时 间 序 列 中 的 新 息 异常 什 


计算 并 显示 时 间 序 列 的 扩展 自 相关 函数 


模拟 GARCH 过 程 
HHS GARCH 模型 进行 最 优 拟 合 检验 
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函数 
harmonic 


Keenan. test 
kurtosis 
lagplot 
perlodogram 


LB. test 


McLeod. Li. test 


plot. Arima 
predict. TAR 


prewhiten 


gar. sim 


rstandard. Arima 


runs 


season 


skewness 


spec 


summary. armasubsets 


tar 
tar. sim 


tar. skeleton 


tlrt 


Tsay. test 


tsdiag. Arima 


tsdiag. TAR 


zlag 
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( 续 ) 
描述 

创建 前 m 对 调和 旺 数 的 矩阵 ， 用 以 拟 合 时 间 序 列 响应 的 一 个 调和 趋势 (余弦 一 正弦 趋 
势 ， 伍 里 叶 回 归 ) 模型 

对 人 时 间 序 列 服从 AR 过 程 的 零 假设 进行 Keenan 非 线 性 检验 

计算 GIE) 峰 度 系数 

计算 并 绘制 时 间 序 列 关于 其 不 同 滞后 的 非 参数 回归 函数 

计算 时 间 序 列 的 周期 图 

计算 Ljung-Box 或 Box-Pierce 检验 ， 以 检验 ARIMA 模型 的 残 差 是 否 为 拍品 声 

执行 条 件 异 方差 McLeod-Li 检验 (ARCH) 

基于 氢 合 ARIMA 模型 ， 绘 制 时 间 序 列 及 其 95%% 置 信 区 间 预 测 图 

计算 基于 拟 合 TAR 模型 的 预测 值 ， 假 设 误 差 为 正 态 分 布 ， 预 测 的 分 布 通过 模拟 来 逼近 
根据 AR 模型 拟 合 二 元 序列 的 x PRR ME TRAFA. 或 者 ， 如 果 已 知 是 ARI- 
MA 模型 ， 则 两 个 序列 均 可 用 其 预 白化 ， 继 而 绘制 并 计算 预 白 后 二 元 序列 的 CCF 

模拟 一 个 一 阶 二 次 AR 模型 ， 其 误差 项 是 正 态 分 布 白 虽 声 

计算 拟 合 ARIMA 模型 的 内 部 标准 残 差 


通过 检查 是 否 存在 过 多 或 过 少 的 数值 落 在 中 位 数 以 上 〈 或 以 下 )， 来 检验 数值 序列 的 独 
立 性 


从 时 间 序 列 中 抽取 季节 信息 ， 并 创立 一 个 季节 信息 向 量 ， 如 对 于 月 度数 据 ， 函 数 将 输 
出 一 个 包含 月 度数 据 的 向 量 
计算 数据 集 的 偏 度 系数 


允许 用 户 调用 在 stats 包 中 的 spec. pgram MAMA spec. ar 函数 ， 如 果 存 在 数据 的 季节 
属性 ， 则 其 在 我 们 惯用 的 输出 表达 式 里 将 被 隐 去 ， 变 更 缺 省 设置 为 demean= T,detrend= F, 
taper= 0， 并 人 允许 绘制 置信 区 间 带 

经 典 ARMA 子 集 的 概述 方法 ， 用 于 选取 ARMA FR 

估计 一 个 双 区 域 TAR 模型 

模拟 一 个 双 区 域 TAR 模型 

通过 省 格 TAR 模型 中 的 噪声 项 ， 得 到 TAR 模型 的 骨架 

对 于 零 假 设 为 正 态 AR 过 程 ， 备 择 假 设 为 有 齐 次 的 、 正 态 分 布 误差 的 TAR 模型， 对 门 
限 非 线 性 进行 似 然 比 检 验 

对 时 间 序 列 中 的 二 次 非 线 性 进行 Tsay 检验 

修正 stats 包 中 的 tsdiag 函数 ， 省 略 初始 残 差 ，、 并 显示 Bonferroni 边界 .其 亦 检查 混 
合 检验 中 卡 方 逼近 有 效 的 条 件 

显示 时 间 序 列 图 以 及 标准 残 差 的 样本 ACF， 也 计算 并 显示 用 于 检查 标准 残 差 自 相关 性 
的 混合 检验 

通过 用 NA 替换 缺失 元 素 ， 计 算 某 向 量 的 混 后 
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文件 名 /变量 


airmiles 


alrpass 


beersales 


bluebird, 
(log. sales & price) 


bluebirdlite: 
(log. sales & price) 


boardings; 
(log. boarding 
s & log. price) 


coz 


color 


CREF 


cref. bond 


days 


deere] 


deere? 


deere3 


WRT ARORA 


描述 和 来 源 
美国 月 度 航 空 客 运 里 程 数值 ，01/1996 - 05/2005. 数据 来 源 ，www. bts. gov/xml/ 


air _ traffie/sre/index. xml # MonthlySystem 


Fel Ps A ee See AO Sy, 01/1960— 12/1971. eB, Box, G.E. P., Jenkins, 
G. M., and Reinsel, G. C, Time Series Analysis; Forecasting and Control, second edi- 
tion, Prentice-Hall, Engelwood Cliffs, NJ, 1994 


EARMEN ATR, 01/1975— 12/1990. BRM. Frees, E. W., 
Data Analysis Using Regression Models, Prentice-Hall, Engelwood Cliffs, NJ, 1996 


104 周 里 每 周 Bluebird AEM RH 【新西兰 ) 单位 销 基 及 价格 ， 来自 Dr. Andrew Bale- 
mi 的 网 站 ， 数 据 来 源 ，www. stat. auckland. ac. nz/ ~ balemi/ Assn3. xls 


104 周 里 每 周 Bluebird ENH Gm 单位 销量 及 人 价格， 来自 Dr, Andrew Bale- 
mi 的 网 站 ， 数 据 来 源 ， www. stat. auckland. ac. nz 一 balermi Assn3. xls 


科罗拉多 区 丹佛 市 月 度 公 共 交 通 载 客 量 【多 数 为 公共 汽车 和 轻轨 )，08/2000 - 03/2006. 
数据 来 源 ， 与 科罗拉多 州 丹 佛 市 ， 区 运输 部 项 目 经理 Lee Cryer 的 个 人 通信 .获得 丹佛 市 汽 
Mire RAE RK. SAAR. EREATARA: www. eia doe. gov 


tt KALA AE A BE KE. 01/1994 - 12/2004， 数 据 来 源 ，http: //cdiac. ornl. gov/ 
ftp/ trends/ co2/altsio. co2 


某 化 工 过 程 中 35 个 连续 批 次 的 颜色 属性 ， 数 据 来 源 :， Cryer, J. D and Ryan, T.P., “The 
estimation of sigma for an X chart", Journal of Quality Technology , 22, No.3, 187—192 


CREF (大 学 退休 权益 基金 ) RH BS BRAM. 08/26/04 - 08/15/06. 数据 来 


W: www. tiaa-cref. org/ performance/ retirement, data,index. html 


CREF (大 学 退休 权益 基金 ) 情 券 基金 每 份 日 单价 ，08/26/04 - 08/15/06. 数据 来 


ii. www. tiaa-cref. org/ performance, retirement/data/index. html 


应 收 账 数 据 ，Winegard 公司 产品 分 销 商 付 款 期 的 天 数 . 数据 来 源 ， 得 自 于 英 奥 瓦 州 
(A MRT Winegard 公司 副 总 裁 Mark Selergren 的 个 人 通信 


在 某 一 特定 操作 条 件 下 ，Deere 公司 某 工 业 如 工 过 程 生成 的 偏离 特定 目标 值 的 82 个 
#2 (A (LL 0.000 025 英寸 为 单位 )， 数 据 来 源 : BA FR AGM Moline 市 Deere 公 
司 技术 中 心 的 William F. Fulkerson 的 个 人 通信 


在 某 一 特定 操作 条 件 下 ，PDeere 公司 另 一 个 工业 加 工 过 程 生成 的 偏离 特定 目标 值 的 
102 个 连续 值 (以 0.000 025 Rap WA). SHRM. 得 自 于 伊利 诺 伊 州 Moline 市 
Deere 和 公司 技术 中 心 的 William F. Fulkerson 的 个 人 通信 


得 自 于 Deere 公司 复杂 机 床 的 57 个 连续 数值 ， 这 些 数值 是 偏离 目标 值 的 数量 【单位 
是 干 万 分 之 一 英尺 )， 过 程 应 用 的 控制 机 制 是 ， 根 据 上 期 产品 偏离 目标 值 的 大 小 来 重新 
设置 相关 机 械 参 数 ， 数 据 来 源 ， 得 自 于 伊利 诺 仇 州 Moline 市 Deere 公司 技术 中 心 的 
William F. Fulkerson 的 个 人 通信 


页 号 

180 

T5 

37 

193 

179., 197, 
199 

170 

fy 95, 1M, 
116, 126, 
139 

201 

227 

104, lad, 
155, 200 
103, 199 
103 

103, 123. 
136, 155 


340 HR II 


(SE) 


ATER x 


脑 电 图 是 一 种 非 介 人 型 测试 ， 用 以 检测 和 记录 大 脑 中 产生 的 电信 号 活动 ， 数 据 得 自 
对 某 瘾 痫 患者 的 检测， 采样 频率 是 每 秒 256 次 .有 关 数 据 为 Richard Smith 教授 网 站 中 


ie 序列 的 一 个 部 分 北 加 利 福 尼 亚 大 学 )， 数 据 来 源 ，http: //www. stat. unc. edu/facul- | “0 
ty/rs/s133/Data/datadoc. html 
R : Tl, 153, 
dlectricit 美国 所 有 发 电 类 型 的 月 发 电量 〈 百 万 千瓦 时 )， 煤 、 天 然 气 、 核 能、 石油 和 风力 ， 179, 191¢ 
J 01/1973 - 12/2005. 数据 来 源 ， www. cia. doe. gov/emeu/mer/elect. html oye j 


m 自作 者 之 一 (JDC，Tempered Brass 乐团 成 员 ) 用 上 低音 号 演奏 的 0.4 秒 降 B 调 数 | ，。 
j 字 化 声音 文件 


在 艾 奥 瓦 州 瓦 佩 洛 测 量 的 爱 荷 华 河 的 流量 数据 〔 立 方 英尺 每 秒 ) 09/1958 - 08/ 


2006。 数据 来 源 ， http: //waterdata. usgs. gov/ia/nwis/sw 265, 271 
Id 每 日 人 金价 (9% 764 HA), 01/04/2005 - 12/30/2005. Hc HHH: www. lbma. = 
ii org. uk/2005dailygold. htm : 
| Google 股票 的 日 收益 率 08/20/04 - 09/13/06， 数 据 来 源 ; http: //finance. ya- 227 
= hoo. com/q/ hp$s= GOOG 
如 拿 大 墅 免 年 丰 度 数量 ，1905 一 1935， 数 据 来 源 : Stenseth, N.C., Falck, W., err 
h Bjérnstad, O. N. 和 Krebs. C.J. (1997) “Population regulation in snowshoe hare and ae a 
sa Canadian lynx: Asymmetric food web configurations between hare and lynx." Proceed- ae i n 
ings of theNatlional Academy of Scinces, USA, 94, 5147—5152 
N 美国 制造 部 门 周平 均 工作 小 时 数 的 月 度数 据 ，07/1982 一 06/1987， 数 据 来 源 :Cr- | ,， 
ac yer, J. D. Time Series Analysis, Duxbury Press, Boston, 1986 
7 美国 Johnson & Johnson 公司 的 每 股 季 上 度 收 入 ，1960 年 第 一 季度 - 1980 年 第 四 季 | 75, 
E., 来自 David Stoffer 的 网 站 ， 数 据 来 源 ，www. stat. pitt. edu/stotfer/tsaZ,/ 179 
加 利 福 尼 亚 州 洛杉矶 市 年 降雨 量 总 计 ，1878 一 1992。 RRR: MABE DRS | 1， 
larain 特 波 莫 商学 院 Donald Bentley HHA TAD ff. ESKESEN: www. wrh. noaa. gov/ | 36, 75, 
lox/climate/cve. php 94, 270 
+k 美国 月 度 牛 奶 产 量 ，01/1994 一 12/2005. 数据 来 源 ， 国家 农业 统计 局 usda. | 191, 266, 
= mannlib. cornell. edu, MannUsda/ viewDocumentInfo. do? documentID=1103 266 
| 63, 88, 
PRT 月 度 原 油 现货 价格 ， 俄 州 ，Cushing( 美 元 每 桶 )，01/1986 一 01/2006. 美国 能 源 信 息 
oil. price , , 108, 127, 
署 ， 数 据 来 源 ，tonto. eia. doe. gov/dnav/ pet/hist/rwtcM. htm 200, 227 
afl 月 度 特 种 机 油 过 滤器 批发 数据 ，Deere 公司 07/1983 06/1987. 数据 来 源 ; HAT 
Caer (RALEA Moline 市 Deere 公司 技术 中 心 的 William F. Fulkerson 的 个 人 通信 
美国 月 度 平均 处 方药 成 本 08/1986 — 03/1992, SKI KW, Frees, E. W., Data A- | 38 
nalysis Using Regression Models, Prentice-Hall, Engelwood Cliffs, NJ, 1996 
J UK (英国 ) ARTEA GERRA. HIA), 01/1983—12/1987. 数据 来 源 : a8 
a www. Statistics. gov. uk/statbase/TSDdownload1. asp 
103, 123, 
poe 某 工业 机 器 人 在 名 次 规定 系列 演习 中 在 “xz” 方向 最 终 位 置 的 序列 ， 数 据 来 源 ， 得 日 ee 


Ft AE Gt Moline 市 Deere 公司 技术 中 心 的 William F. Fulkerson 的 个 人 通信 264 
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文件 名 /变量 


SP 


spots 


spots! 


star 


tbone 


tempdub 


units 


usd. hkd 


veilleux; Day, 
Didinium, 
Paramecium 


wages 


winnebago 


(  ) 
描述 和 来 源 页 号 
季度 标准 普尔 综合 指数 ，1936 年 第 一 季度 - 1977 年 第 四 季度 ， 数 据 来 源 :， Frees, 


E.W., Data Analysis Using Regression Models, Prentice-Hall, Engelwood Cliffs, | 74 
NJ, 1996 


年 度 美国 (相对 〉 太阳 黑子 数 ，1945 - 2005. RE HID 太阳 黑子 数 是 观测 站 网 


络 所 获得 的 太阳 活动 记录 的 加 权 平 均值 . 数据 来 源 ，www,ngdc. noaa. gov/stp/SO- | 280 


LAR/ftpsunspotnumber. html # american 


年 度 国 际 太 阳 黑 子 数 ，1700 一 2005， 美国 国家 地 球 物 理学 数据 中 心 。 数 据 来 源 : 


ftp. ngdc. noaa. gov/STP/SOLAR _ DATA/SUNSPOT _ NUMBERS/ YEARLY. PLT iio 

600 个 连续 夜晚 记录 的 变星 亮度 系列 . 数据 来 源 : www. statsci. org/data/general/ 
star. html 

作者 之 一 的 朋友 (Chuck Kreeb, Tempered Brass 乐园 成 员 ) 用 上 低音 长 号 演奏 的 ane 
0.4 秒 降 B 调 数字 化 声音 文件 

莫 奥 无 州 迪 比 克 市 月 平均 气温 ，1/1964 - 12/1975. 数据 来 源 ，http: //mesonet. | 4, 153, 
agron, iastate. edu/climodat/index. phtml? station= ia2364& report= 16 270 


作者 之 一 的 朋友 (Linda Fisher, Tempered Brass 乐团 成 员 ) 用 低音 号 演奏 的 0.4 秒 271 
降 B 调 一 个 八 度 及 中 音 C 下 一 个 音阶 的 数字 化 声音 文件 
某 大 型 设备 年 度 销售 数据 ，1983 一 2005 (来 自 某 大 型 跨国 公司 的 专 有 销售 数据 ) 200 


美元 对 港币 的 日 汇率 ，01/2005 - 03/2006. 对 以 下 六 个 变量 所 做 的 431 个 观测 值 的 
数据 结构 : 
r: 美元 对 港币 汇率 的 日 收益 率 
v: 基于 AR(1) 十 GARCH(3，1) 的 估计 条 件 方差 
hkrate; 美元 对 港币 的 日 汇率 224 
outlier]; 203 日 的 虚拟 变量 ， 对 应 2005 7 H 22H 
outlier2; 290 日 的 虚拟 变量 ， 另 一 个 可 能 的 异常 值 
day; 日 历 日 
数据 来 源 ，www. oanda, com/convert/fxhistory 


研究 捕食 者 动态 的 二 元 时 间 序 列 . 第 一 个 时 间 序 列 包含 35 天 周期 内 每 12 小 时 测量 
得 出 的 每 毫升 猎物 个 体 数 量 (Didinium natsutum). 第 二 个 时 间 序 列 包含 相 应 的 每 毫 
升 捕食 者 数量 〈Paramecixm aurelia)， 数 据 来 源 ，Veilleux，B. G. (1976) “The analy- 
sis of a predatory interaction between Didinium and Paramecium.” MSc thesis, Univer- 
sity of Alberta, Canada 

也 可 参见 ，www. journals. royalsoc. ac. uk/content/lekvOyqp2ecpabvd/archivel. pdf 


276 


HERAA EA et BE, 07/1981 - 06/1987. 数据 来 源 :， Cryer, J.D., 
Time Series Analysis, Duxbury Press, Boston, 1986 


37 


Winnebago 公司 大 型 旅行 车 月 度 销售 记录 ，11/1966 - 02/1972. MH HMR: Ro- 
berts, H. V. , Data Analysis for Managers with Minitab, second edition, The Scien- | 37, 74 
tific Press, Redwood City, CA, 1991 
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